다음을 통해 공유


AZURE Container for PyTorch(ACPT)

PyTorch용 Azure Container는 Azure Machine Learning에서 대규모 모델에 최적화된 교육을 효과적으로 실행하는 데 필요한 구성 요소를 포함하는 간단한 독립 실행형 환경입니다. Azure Machine Learning 큐레이팅된 환경 은 기본적으로 사용자의 작업 영역에서 사용할 수 있으며 최신 버전의 Azure Machine Learning SDK를 사용하는 캐시된 Docker 이미지로 지원됩니다. 준비 비용을 줄이고 배포 시간을 단축하는 데 도움이 됩니다. ACPT를 사용하여 Azure에서 PyTorch를 사용하여 다양한 딥 러닝 작업을 빠르게 시작할 수 있습니다.

참고 항목

Python SDK, CLI 또는 Azure Machine Learning 스튜디오를 사용하여 전체 환경 및 종속 항목 목록을 가져옵니다. 자세한 내용은 환경 문서를 참조 하세요.

ACPT를 사용해야 하는 이유는 무엇인가요?

  • 유연성: 미리 설치된 패키지와 함께 있는 그대로 사용하거나 큐레이팅된 환경을 기반으로 빌드합니다.
  • 사용 편의성: 모든 구성 요소는 설치 비용을 줄이고 가치 창출 시간을 가속화하기 위해 수십 개의 Microsoft 워크로드에 대해 설치 및 유효성 검사를 수행합니다.
  • 효율성: 불필요한 이미지 빌드를 피하고 이미지/컨테이너에서 바로 액세스할 수 있는 필수 종속성만 있습니다.
  • 최적화된 학습 프레임워크: 대규모 워크로드에서 PyTorch 모델을 설정, 개발 및 가속화하고, 학습 및 배포 성공률을 향상시킵니다.
  • 최신 스택: 호환되는 최신 버전의 Ubuntu, Python, PyTorch, CUDA/RocM 등에 액세스합니다.
  • 최신 학습 최적화 기술: ONNX 런타임, DeepSpeed, MSCCL 등을 사용합니다.
  • Azure Machine Learning과의 통합: Azure Machine Learning 스튜디오 또는 SDK를 사용하여 PyTorch 실험을 추적합니다. 또한 Azure 고객 지원은 학습 및 배포 대기 시간을 줄입니다.
  • DSVM으로 가용성: 이미지는 데이터 과학 DSVM(Virtual Machine)으로도 사용할 수 있습니다. 데이터 과학 Virtual Machines에 대한 자세한 내용은 DSVM 개요 설명서를 참조하세요.

Important

큐레이팅된 환경 패키지 및 버전에 대한 자세한 내용을 보려면 Azure Machine Learning 스튜디오의 환경 탭을 방문하세요.

ACPT(Azure Container for PyTorch)에 대해 지원되는 구성

설명: Azure Curated Environment for PyTorch는 최신 PyTorch 큐레이팅 환경입니다. 대규모 분산 딥 러닝 워크로드에 최적화되어 있으며 가속화된 학습(예: ORT(Onnx Runtime Training), DeepSpeed, MSCCL 등)을 위한 최고의 Microsoft 기술로 미리 패키지됩니다.

현재 지원되는 구성은 다음과 같습니다.

환경 이름 OS GPU 버전 Python 버전 PyTorch 버전 ORT 학습 버전 DeepSpeed 버전 torch-ort 버전 Nebula 버전
acpt-pytorch-2.2-cuda12.1 Ubuntu 20.04 cu121 3.10 2.2.2 1.17.3 0.13.1 1.17.3 0.16.11
acpt-pytorch-2.1-cuda12.1 Ubuntu 20.04 cu121 3.10 2.1.2 1.17.3 0.13.1 1.17.3 0.16.11
acpt-pytorch-2.0-cuda11.7 Ubuntu 20.04 cu117 3.10 2.0.1 1.17.3 0.13.1 1.17.3 0.16.11
acpt-pytorch-1.13-cuda11.7 Ubuntu 20.04 cu117 3.10 1.13.1 1.17.3 0.13.1 1.17.3 0.16.11

fairscale, horovod, msccl, protobuf, pyspark, pytest, pytorch-lightning, tensorboard, NebulaML, torchvision 및 torchmetrics와 같은 기타 패키지는 모든 학습 요구를 지원하기 위해 제공됩니다.

자세한 내용은 사용자 지정 ACPT 큐레이팅 환경 만들기를 참조 하세요.

지원

참조하는 기본 이미지를 포함하는 지원되는 환경에 대한 버전 업데이트는 30일이 넘은 취약점을 해결하기 위해 2주마다 릴리스됩니다. 사용량에 따라 일부 환경은 더 일반적인 기계 학습 시나리오를 지원하기 위해 사용되지 않을 수 있습니다(제품에서 숨겨지지만 사용 가능).