다음을 통해 공유


ND-H100-v5 크기 시리즈

ND H100 v5 시리즈 VM(가상 머신)은 Azure GPU 제품군에 새롭게 추가된 주력 제품입니다. 이 시리즈는 고급 딥 러닝 학습과 긴밀하게 결합된 스케일 업 및 스케일 아웃 생성형 AI 및 HPC 워크로드를 위해 설계되었습니다.

ND H100 v5 시리즈는 단일 VM과 8개의 NVIDIA H100 Tensor Core GPU로 시작합니다. ND H100 v5 기반 배포는 VM당 3.2Tbps의 상호 연결 대역폭을 사용하여 수천 개의 GPU로 스케일 업할 수 있습니다. VM 내의 각 GPU에는 고유한 전용 토폴로지 독립적 400Gb/s NVIDIA Quantum-2 CX7 InfiniBand 연결이 제공됩니다. 이러한 연결은 동일한 가상 머신 확장 집합을 차지하는 VM 간에 자동으로 구성되며 GPU 직접 RDMA를 지원합니다.

각 GPU는 VM 내 통신을 위한 NVLINK 4.0 연결을 제공하며 인스턴스에는 96개의 물리적 4세대 Intel Xeon 확장 가능 프로세서 코어에서 지원됩니다.

이러한 인스턴스는 GPU 가속화를 ‘기본으로’ 지원하는 많은 AI, ML, 분석 도구(예: TensorFlow, Pytorch, Caffe, RAPIDS, 다른 프레임워크)에 탁월한 성능을 제공합니다. 또한 스케일 아웃 InfiniBand 상호 연결은 GPU의 원활한 클러스터링을 위해 NVIDIA의 NCCL 통신 라이브러리를 기반으로 하는 대규모 기존 AI 및 HPC 도구 집합에서 지원됩니다.

호스트 사양

요소 수량
개수 단위
사양
SKU ID, 성능 단위 등
프로세서 96개 vCPU Intel Xeon(Sapphire Rapids) [x86-64]
메모리 1900GiB
로컬 스토리지 1개 디스크 28000GiB
원격 스토리지 32디스크
네트워크 8NIC
가속기 GPU 8개 Nvidia H100 GPU(80GB)

기능 지원

Premium Storage: 지원됨
Premium Storage 캐싱: 지원됨
실시간 마이그레이션: 지원되지 않음
메모리 보존 업데이트: 지원되지 않음
2세대 VM: 지원됨
1세대 VM: 지원되지 않음
가속화된 네트워킹: 지원됨
임시 OS 디스크: 지원됨
중첩 가상화: 지원되지 않음
Infiniband: 지원됨

Important

ND H100 v5 VM을 시작하려면 HPC 워크로드 구성 및 최적화에서 드라이버 및 네트워크 구성 등의 단계를 참조하세요. GPU 메모리 I/O 공간 증가로 인해 ND H100 v5에는 2세대 VM 및 마켓플레이스 이미지를 사용해야 합니다.

Azure는 ND H100 v5 VM용 Ubuntu 20.04/22.04, RHEL 7.9/8.7/9.3, AlmaLinux 8.8/9.2 및 SLES 15를 지원합니다. 현재 Ubuntu-HPC 20.4/22.04 및 AlmaLinux-HPC 8.6/8.7 VM 이미지가 지원됩니다.

다양한 HPC 도구 및 라이브러리가 설치된 HPC/AI 워크로드에 최적화되고 미리 구성된 Linux VM 이미지가 제공되므로 권장됩니다.

이미지를 다운로드하려면 Azure Marketplace로 이동하세요.

시리즈별 크기

각 크기별 vCPU(수량) 및 메모리

크기 이름 vCPU(수량) 메모리(GB)
Standard_ND96isr_H100_v5 96 1900

VM 기본 리소스

기타 사이즈 정보

사용 가능한 모든 크기 목록: 크기

가격 계산기: 가격 계산기

디스크 유형에 대한 정보: 디스크 유형

다음 단계

ACU(Azure 컴퓨팅 단위)가 Azure SKU 간의 Compute 성능을 비교하는 데 어떻게 도움을 줄 수 있는지 알아봅니다.

하나의 Azure 구독에 할당된 하나 이상의 가상 머신을 호스팅할 수 있는 실제 서버에 대해서는 Azure Dedicated Host를 확인합니다.

Azure Virtual Machines 모니터링 방법을 알아봅니다.