딥 러닝
이 문서에서는 Azure Databricks에서 딥 러닝 모델을 개발하고 미세 조정하기 위한 PyTorch, Tensorflow 및 분산 학습 사용에 대한 간략한 소개를 제공합니다. 또한 이러한 도구를 사용하는 방법을 보여 주는 예제 전자 필기장이 있는 페이지에 대한 링크도 포함되어 있습니다.
- Azure Databricks에서 딥 러닝 워크플로를 최적화하는 방법에 대한 일반적인 지침은 Azure Databricks에서 딥 러닝을 위한 모범 사례를 참조하세요.
- Azure Databricks에서 대규모 언어 모델 및 생성 AI를 사용하는 방법에 대한 자세한 내용은 다음을 참조하세요.
PyTorch
PyTorch는 Databricks Runtime ML에 포함되어 있으며, GPU 가속 텐서 계산과 딥 러닝 네트워크를 구축하기 위한 고수준 기능을 제공합니다. Databricks에서 PyTorch를 사용하여 단일 노드 학습 또는 분산 학습을 수행할 수 있습니다. PyTorch를 참조하세요.
TensorFlow
Databricks Runtime ML에는 TensorFlow 및 TensorBoard가 포함되어 있으므로 패키지를 설치하지 않고도 이러한 라이브러리를 사용할 수 있습니다. TensorFlow는 CPU, GPU 및 GPU 클러스터에 대한 딥 러닝 및 일반 수치 컴퓨팅을 지원합니다. TensorBoard는 기계 학습 및 딥 러닝 워크플로를 디버그하고 최적화하는 데 도움이 되는 시각화 도구를 제공합니다. 단일 노드 및 분산 학습 예제는 TensorFlow를 참조하세요.
분산 학습
딥 러닝 모델은 데이터 및 계산을 많이 사용하므로 분산 학습이 중요할 수 있습니다. Ray, TorchDistributor, DeepSpeed와의 통합을 사용하는 분산형 딥 러닝의 예는 분산 학습을 참조하세요.
딥 러닝 모델 개발 추적
추적은 MLflow 에코시스템의 초석으로 남아 있으며 딥 러닝의 반복적 특성에 특히 중요합니다. Databricks는 MLflow를 사용하여 딥 러닝 학습 실행 및 모델 개발을 추적합니다. MLflow를 사용하여 모델 개발 추적을 참조하세요.