La macchina virtuale della serie ND MI300X v5 è una nuova aggiunta principale alla famiglia GPU di Azure. È stata progettata per il training di Deep Learning di fascia alta e per i carichi di lavoro HPC e di AI generativa con scalabilità orizzontale e verticale.
La macchina virtuale serie ND MI300X v5 inizia con otto GPU AMD Instinct MI300 e due processori scalabili Intel Xeon di quarta generazione per un totale di 96 core fisici. Ogni GPU all'interno della macchina virtuale viene quindi connessa alle altre tramite collegamenti AMD Infinity Fabric di quarta generazione con larghezza di banda di 128 GB/s per GPU e 896 GB/s di larghezza di banda aggregata.
Le distribuzioni basate su ND MI300X v5 possono aumentare fino a migliaia di GPU con 3,2 TB/s di larghezza di banda di interconnessione per macchina virtuale. Ogni GPU all'interno della macchina virtuale viene fornita con una propria connessione InfiniBand dedicata e indipendente dalla topologia 400 Gb/s NVIDIA Quantum-2 CX7. Queste connessioni vengono configurate automaticamente tra le macchine virtuali che occupano lo stesso set di scalabilità di macchine virtuali e supportano GPUDirect RDMA.
Queste istanze offrono prestazioni eccellenti per molti strumenti di intelligenza artificiale, Machine Learning e analisi che supportano l'accelerazione GPU "predefinita", ad esempio TensorFlow, Pytorch e altri framework. Inoltre, l'interconnessione InfiniBand con scalabilità orizzontale supporta un ampio set di strumenti di intelligenza artificiale e HPC esistenti basati su AMD’ROCm Communication Collectives Library (RCCL) per un clustering semplice delle GPU.
Specifiche dell'host
In parte
Quantità Conteggio delle unità
Specifiche ID SKU, unità delle prestazioni e così via.
Processore
96 vCPU
Intel Xeon (Sapphire Rapids) [x86-64]
Memoria
1850 GiB
Archiviazione locale
1 disco temporaneo 8 dischi NVMe
Dischi temporanei da 1000 GiB Dischi NVMe da 28000 GiB
1La velocità del disco temporaneo differisce spesso tra le operazioni RR (Random Read) e RW (Random Write). Le operazioni RR sono in genere più veloci rispetto a quelle RW. La velocità RW è in genere più lenta rispetto a quella RR nelle serie in cui è elencato solo il valore di velocità RR.
La capacità di archiviazione viene visualizzata in unità di GiB o 1.024^3 byte. Quando si confrontano dischi misurati in GB (1000^3 byte) con dischi misurati in GiB (1024^3), tenere presente che i valori di capacità specificati in GiB potrebbero apparire inferiori. Ad esempio, 1.023 GiB = 1.098,4 GB.
La velocità effettiva del disco viene misurata in operazioni di input/output al secondo (IOPS) e MBps, dove il valore di MBps corrisponde a 10^6 byte al secondo.
1Alcune dimensioni supportano il bursting per migliorare temporaneamente le prestazioni del disco. La velocità di burst può essere mantenuta per un massimo di 30 minuti alla volta.
La capacità di archiviazione viene visualizzata in unità di GiB o 1.024^3 byte. Quando si confrontano dischi misurati in GB (1000^3 byte) con dischi misurati in GiB (1024^3), tenere presente che i valori di capacità specificati in GiB potrebbero apparire inferiori. Ad esempio, 1.023 GiB = 1.098,4 GB.
La velocità effettiva del disco viene misurata in operazioni di input/output al secondo (IOPS) e MBps, dove il valore di MBps corrisponde a 10^6 byte al secondo.
I dischi dati possono operare in modalità memorizzata nella cache o non memorizzata nella cache. Per il funzionamento dei dischi dati memorizzati nella cache, la modalità di cache host è impostata su ReadOnly o su ReadWrite. Per il funzionamento dei dischi dati non memorizzati nella cache, la modalità di cache host è impostata su None.
La larghezza di banda della rete prevista è la larghezza di banda aggregata massima allocata per ogni tipo di macchina virtuale in tutte le schede di interfaccia di rete, per tutte le destinazioni. Per altre informazioni, vedere Larghezza di banda di rete delle macchine virtuali
I limiti superiori non sono garantiti. I limiti offrono indicazioni per la selezione del tipo di macchina virtuale appropriato per l'applicazione desiderata. Le prestazioni di rete effettive dipenderanno da svariati fattori, tra cui congestione della rete, carichi dell'applicazione e impostazioni di rete. Per informazioni sull'ottimizzazione della velocità effettiva della rete, vedere Ottimizzare la velocità effettiva di rete per macchine virtuali di Azure.
Per realizzare le prestazioni di rete previste in Linux o Windows, potrebbe essere necessario selezionare una versione specifica o ottimizzare la macchina virtuale. Per altre informazioni, vedere Test di larghezza di banda/velocità effettiva (NTTTCP).
Informazioni sull'acceleratore (GPU, FPGA e così via) per ogni dimensione
Nome dimensione
Acceleratori (Qtà)
Memoria dell'acceleratore (GB)
Standard_ND96isr_MI300X_v5
8
1535
Altre informazioni sulle dimensioni
Elenco di tutte le dimensioni disponibili: Dimensioni