Dimensioni della serie ND-H100-v5
La macchina virtuale della serie ND H100 v5 è il nuovo fiore all'occhiello della famiglia di GPU di Azure. Questa serie è progettata per il training di Deep Learning di fascia alta e per i carichi di lavoro HPC e di AI generativa con scale-up e scale-out.
La serie ND H100 v5 inizia con una singola macchina virtuale e otto GPU NVIDIA H100 Tensor Core. Le distribuzioni basate su ND H100 v5 possono aumentare fino a migliaia di GPU con 3,2 Tbps di larghezza di banda di interconnessione per macchina virtuale. Ogni GPU all'interno della macchina virtuale viene fornita con una propria connessione InfiniBand dedicata e indipendente dalla topologia 400 Gb/s NVIDIA Quantum-2 CX7. Queste connessioni vengono configurate automaticamente tra le macchine virtuali che occupano lo stesso set di scalabilità di macchine virtuali e supportano GPU Direct RDMA.
Ogni GPU offre connettività NVLINK 4.0 per la comunicazione all'interno della macchina virtuale e l'istanza dispone di 96 core fisici del processore scalabile Intel Xeon di quarta generazione.
Queste istanze offrono prestazioni eccellenti per molti strumenti di intelligenza artificiale, Machine Learning e analisi che supportano l'accelerazione GPU predefinita, ad esempio TensorFlow, Pytorch, Caffe, RAPIDS e altri framework. Inoltre, l'interconnessione InfiniBand scale-out supporta un ampio set di strumenti di intelligenza artificiale e HPC esistenti, basati sulle librerie di comunicazione NCCL di NVIDIA per un clustering semplice della GPU.
Specifiche dell'host
In parte | Quantità Conteggio delle unità |
Specifiche ID SKU, unità delle prestazioni e così via. |
---|---|---|
Processore | 96 vCPU | Intel Xeon (Sapphire Rapids) [x86-64] |
Memoria | 1900 GiB | |
Archiviazione locale | 1 disco | 28000 GiB |
Archiviazione remota | 32dischi | |
Rete | 8 schede di interfaccia di rete | |
Acceleratori | 8 GPU | GPU Nvidia H100 (80 GB) |
Supporto funzionalità
Archiviazione Premium: supportata
Memorizzazione nella cache Archiviazione Premium: supportata
Live Migration: non supportato
Aggiornamenti con mantenimento della memoria: non supportati
Macchine virtuali di seconda generazione: supportate
Macchine virtuali di prima generazione: non supportate
Rete accelerata: supportata
Disco del sistema operativo temporaneo: supportato
Virtualizzazione annidata: non supportata
Infiniband: supportato
Importante
Per iniziare a usare macchine virtuali ND H100 v5, vedere Configurazione e ottimizzazione del carico di lavoro HPC per i passaggi, tra cui driver e configurazione di rete. A causa dell'aumento del footprint di I/O della memoria GPU, ND H100 v5 richiede l'uso di macchine virtuali di seconda generazione e immagini del marketplace.
supporto tecnico di Azure Ubuntu 20.04/22.04, RHEL 7.9/8.7/9.3, AlmaLinux 8.8/9.2 e SLES 15 per macchine virtuali ND H100 v5. Attualmente sono supportate immagini di macchine virtuali Ubuntu-HPC 20.4/22.04 e AlmaLinux-HPC 8.6/8.7.
Sono disponibili offerte di immagini di macchine virtuali Linux ottimizzate e preconfigurate per carichi di lavoro HPC/INTELLIGENZa artificiale con un'ampia gamma di strumenti e librerie HPC installati e pertanto sono altamente consigliati.
Per scaricare un'immagine, passare ad Azure Marketplace.
Dimensioni nella serie
vCPU (Qtà) e memoria per ogni dimensione
Nome dimensione | vCPU (Qtà) | Memoria (GB) |
---|---|---|
Standard_ND96isr_H100_v5 | 96 | 1900 |
Risorse di base della macchina virtuale
Altre informazioni sulle dimensioni
Elenco di tutte le dimensioni disponibili: Dimensioni
Calcolatore dei prezzi: Calcolatore dei prezzi
Informazioni sui tipi di dischi: Tipi di dischi
Passaggi successivi
Sfruttare le prestazioni e le funzionalità più recenti disponibili per i carichi di lavoro modificando le dimensioni di una macchina virtuale.
Usare processori ARM progettati internamente da Microsoft con macchine virtuali Cobalt di Azure.
Informazioni su come Monitorare le macchine virtuali di Azure.