Serie de tamaños SD-H100-v5
La máquina virtual (VM) de la serie ND H100 v5 es una nueva adición estrella de la familia de GPU de Azure. Esta serie se ha diseñado para el entrenamiento de aprendizaje profundo de alto nivel y cargas de trabajo de HPC y de IA generativa de escalabilidad horizontal y vertical estrechamente acopladas.
La serie ND H100 v5 comienza con una sola máquina virtual y ocho GPU NVIDIA H100 Tensor Core. Las implementaciones basadas en ND H100 v5 se pueden escalar verticalmente hasta miles de GPU con un ancho de banda de interconexión de 3,2 Tbps por máquina virtual. Cada GPU incluida en la máquina virtual se proporciona con su propia conexión InfiniBand de NVIDIA Quantum-2 CX7 de 400 Gb/s dedicada e independiente de la topología. Estas conexiones se configuran automáticamente entre máquinas virtuales que ocupan el mismo conjunto de escalado de máquinas virtuales y admiten RDMA de GPU Direct.
Cada GPU incluye conectividad NVLINK 4.0 para la comunicación dentro de la máquina virtual, y la instancia tiene 96 núcleos físicos de procesador escalables Intel Xeon de cuarta generación.
Estas instancias proporcionan un rendimiento excelente para muchas herramientas de IA, ML y análisis que admiten la aceleración GPU de serie, como TensorFlow, Pytorch, Caffe, RAPIDS y otras plataformas. Además, la interconexión InfiniBand de escalabilidad horizontal es compatible con un gran conjunto de herramientas de inteligencia artificial y HPC existentes creadas en las bibliotecas de comunicación NCCL de NVIDIA para una agrupación en clústeres de GPU sin problemas.
Especificaciones del host
Parte | Cantidad Unidades de recuento |
Especificaciones Id. de SKU, unidades de rendimiento, etc. |
---|---|---|
Procesador | 96 CPU virtuales | Intel Xeon (Sapphire Rapids) [x86-64] |
Memoria | 1900 GiB | |
Almacenamiento local | 1 disco | 28000 GiB |
Almacenamiento remoto | 32Discos | |
Red | 8 NICs | |
Aceleradores | 8 GPU | Nvidia H100 GPU (80 GB) |
Compatibilidad de características
Premium Storage: admitido
Almacenamiento en caché de Premium Storage: admitido
Migración en directo: no admitido
Actualizaciones con conservación de memoria: no admitido
Máquinas virtuales de generación 2: compatibles
Máquinas virtuales de generación 1: no compatibles
Redes aceleradas: compatible
Disco de SO efímero: compatible
Virtualización anidada: no compatible
Infiniband: admitida
Importante
Para empezar a trabajar con las máquinas virtuales ND H100 v5, vea Configuración y optimización de cargas de trabajo de HPC para conocer los pasos que incluyen la configuración del controlador y la red. Debido a la mayor superficie de E/S de memoria en la GPU, la serie ND H100 v5 requiere el uso de máquinas virtuales de generación 2 y de imágenes de marketplace.
Azure admite Ubuntu 20.04/22.04, RHEL 7.9/8.7/9.3, AlmaLinux 8.8/9.2 y SLES 15 para máquinas virtuales ND H100 v5. Actualmente, se admiten imágenes de máquinas virtuales Ubuntu-HPC 20.4/22.04 y AlmaLinux-HPC 8.6/8.7.
Hay ofertas de imágenes de máquina virtual Linux optimizadas y preconfiguradas para cargas de trabajo de HPC/AI con una variedad de herramientas y bibliotecas de HPC instaladas y, por lo tanto, son muy recomendables.
Para descargar una imagen, vaya a Azure Marketplace.
Tamaños en serie
vCPU (Qty.) y memoria para cada tamaño
Nombre del tamaño | vCPUs (Qty.) | Memoria (GB) |
---|---|---|
Standard_ND96isr_H100_v5 | 96 | 1900 |
Recursos básicos de máquina virtual
Otra información de tamaño
Lista de todos los tamaños disponibles: Tamaños
Calculadora de precios: Calculadora de precios
Información sobre los tipos de disco: Tipos de disco
Pasos siguientes
Obtenga más información sobre cómo las unidades de proceso de Azure (ACU) pueden ayudarlo a comparar el rendimiento en los distintos SKU de Azure.
Vea Hosts dedicados de Azure para servidores físicos que puedan hospedar una o varias máquinas virtuales asignadas a una suscripción de Azure.
Aprenda a Supervisión de máquinas virtuales de Azure.