La máquina virtual (VM) de la serie ND MI300X v5 es una nueva adición estrella de la familia de GPU de Azure. Ha sido diseñada para el entrenamiento de aprendizaje profundo de alto nivel y cargas de trabajo de HPC y de IA generativa de escalabilidad horizontal y vertical estrechamente acopladas.
La máquina virtual de la serie ND MI300X v5 comienza con ocho GPU AMD Instinct MI300 y dos procesadores escalables Intel Xeon de cuarta generación para un total de 96 núcleos físicos. Cada GPU dentro de la máquina virtual se conecta con el resto a través de los vínculos AMD Infinity Fabric de 4.ª generación con ancho de banda de 128 GB/s por GPU y ancho de banda agregado de 896 GB/s.
Las implementaciones basadas en ND MI300X v5 se pueden escalar verticalmente hasta miles de GPU con un ancho de banda de interconexión de 3,2 Tb/s por máquina virtual. Cada GPU incluida en la máquina virtual se proporciona con su propia conexión InfiniBand de NVIDIA Quantum-2 CX7 de 400 Gb/s dedicada e independiente de la topología. Estas conexiones se configuran automáticamente entre máquinas virtuales que ocupan el mismo conjunto de escalado de máquinas virtuales y admiten RDMA de GPUDirect.
Estas instancias proporcionan un rendimiento excelente para muchas herramientas de IA, ML y análisis que admiten la aceleración GPU de serie, como TensorFlow, Pytorch y otras plataformas. Además, la interconexión InfiniBand de escalabilidad horizontal es compatible con un gran conjunto de herramientas de inteligencia artificial y HPC existentes creadas en ROCm Communication Collectives Library (RCCL) de AMD para una agrupación en clústeres de GPU sin problemas.
Especificaciones del host
Parte
Cantidad Unidades de recuento
Especificaciones Id. de SKU, unidades de rendimiento, etc.
Procesador
96 CPU virtuales
Intel Xeon (Sapphire Rapids) [x86-64]
Memoria
1850 GiB
Almacenamiento local
1 disco temporal 8 discos NVMe
Disco temporal de 1000 GiB Discos NVMe de 28000 GiB
1La velocidad del disco temporal a menudo difiere entre las operaciones de RR (lectura aleatoria) y RW (escritura aleatoria). Las operaciones de RR suelen ser más rápidas que las operaciones de RW. La velocidad de RW suele ser más lenta que la velocidad de RR en las series donde solo se indica el valor de velocidad de RR.
La capacidad de almacenamiento se muestra en unidades de GiB o 1024^3 bytes. Cuando compare discos que se miden en GB (1000^3 bytes) con discos que se miden en GiB (1024^3), recuerde que los números que representan la capacidad en GiB pueden parecer más pequeños. Por ejemplo, 1023 GiB = 1098,4 GB.
Se midió el rendimiento de disco en operaciones de entrada/salida por segundo (E/S por segundo) y MBps, donde Mbps = 10^6 bytes/s.
1Algunos tamaños admiten expansión para aumentar temporalmente el rendimiento del disco. Las velocidades de ráfaga se pueden mantener hasta 30 minutos a la vez.
La capacidad de almacenamiento se muestra en unidades de GiB o 1024^3 bytes. Cuando compare discos que se miden en GB (1000^3 bytes) con discos que se miden en GiB (1024^3), recuerde que los números que representan la capacidad en GiB pueden parecer más pequeños. Por ejemplo, 1023 GiB = 1098,4 GB.
Se midió el rendimiento de disco en operaciones de entrada/salida por segundo (E/S por segundo) y MBps, donde Mbps = 10^6 bytes/s.
Los discos de datos pueden funcionar en modo en caché o en modo no en caché. En el caso de la operación de disco de datos en caché, el modo de caché del host está establecido en ReadOnly o ReadWrite. En el caso de la operación de disco de datos no en caché, el modo de caché del host está definido en None.
El ancho de banda de red esperado es el ancho de banda agregado máximo asignado por tipo de máquina virtual en todas las NIC y para todos los destinos. Para obtener más información, vea Ancho de banda de red de máquina virtual
No se garantizan los límites superiores. Los límites ofrecen una guía para seleccionar el tipo de máquina virtual adecuado para la aplicación prevista. El rendimiento de red real dependerá de diversos factores (como, por ejemplo, la congestión de la red, las cargas de la aplicación y la configuración de red). Para más información sobre cómo optimizar el rendimiento de red, consulte Optimización del rendimiento de red en las máquinas virtuales de Azure.
Para lograr el rendimiento de red esperado en Linux o Windows, puede que deba seleccionar una versión específica u optimizar la máquina virtual. Para obtener más información, vea Pruebas de ancho de banda y rendimiento (NTTTCP).
Información del acelerador (GPU, FPGA, etc.) para cada tamaño