Panoramica delle macchine virtuali serie HC
Si applica a: ✔️ macchine virtuali Linux ✔️ macchine virtuali Windows ✔️ set di scalabilità flessibili ✔️ set di scalabilità uniformi
L'ottimizzazione delle prestazioni delle applicazioni HPC nei processori scalabili Intel Xeon richiede un approccio ponderato per elaborare il posizionamento in questa nuova architettura. Di seguito viene illustrata l'implementazione di questa architettura nelle macchine virtuali della serie HC di Azure per le applicazioni HPC. Vengono usati i termini “pNUMA” per fare riferimento a un dominio NUMA fisico e “vNUMA” per fare riferimento a un dominio NUMA virtualizzato. Analogamente, verranno utilizzati i termini “pCore” per fare riferimento a core CPU fisici e “vCore” per fare riferimento ai core CPU virtualizzati.
Da un punto di vista fisico, un server serie HC consiste in una CPU EPYC 8168 con 2 * 24 core per un totale di 48 core fisici. Ogni CPU è un singolo dominio pNUMA e ha accesso unificato a sei canali di DRAM. Le CPU Intel Xeon Platinum dispongono di una cache L2 4x più grande rispetto alle generazioni precedenti (256 KB/core -> 1 MB/core) e al tempo stesso di una cache L3 più piccola rispetto alle CPU Intel precedenti (2,5 MB/core -> 1,375 MB/core).
La topologia precedente è stata usata anche per la configurazione dell'hypervisor della serie HC. Per consentire all'hypervisor di Azure di funzionare senza interferire con la macchina virtuale, si riservano i pCore 0-1 e 24-25 (ovvero i primi 2 pCore su ciascun socket). Vengono quindi assegnati domini pNUMA a tutti i core rimanenti alla macchina virtuale. Di conseguenza, la macchina virtuale visualizzerà:
(2 vNUMA domains) * (22 cores/vNUMA) = 44
core per macchina virtuale
La macchina virtuale non sa che non le sono stati assegnati i pCore 0-1 e 24-25. Espone quindi ogni vNUMA come se avesse 22 core in modo nativo.
Le CPU Intel Xeon Platinum, Gold e Silver introducono anche una rete mesh 2D on-die per la comunicazione all'interno e all'esterno del socket della CPU. È consigliabile aggiungere processi per ottenere prestazioni e coerenza ottimali. L'aggiunta dei processi funzionerà nelle macchine virtuali della serie HC perché il processore sottostante è esposto così come è alla macchina virtuale guest.
Il diagramma seguente illustra la separazione dei core riservati per Hypervisor di Azure e la macchina virtuale della serie HC.
Specifiche hardware
Specifiche hardware | Macchina virtuale della serie HC |
---|---|
Core | 44 (HT disabilitato) |
CPU | Intel Xeon Platinum 8168 |
Frequenza CPU (non AVX) | 3,7 GHz (core singolo), 2,7-3,4 GHz (tutti i core) |
Memoria | 8 GB/core (352 totale) |
Disco locale | SSD 700 GB |
InfiniBand | 100 Gb EDR Mellanox ConnectX-5 |
Rete | Ethernet 50 Gb (utilizzabile 40 GB) SmartNIC di seconda generazione di Azure |
Specifiche software
Specifiche software | Macchina virtuale della serie HC |
---|---|
Dimensioni massime processo MPI | 13200 core (300 macchine virtuali in un singolo set di scalabilità di macchine virtuali con singlePlacementGroup=true) |
Supporto MPI | HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI |
Framework aggiuntivi | UCX, libfabric, PGAS |
Supporto di Archiviazione di Azure | Dischi Standard e Premium (massimo 4 dischi) |
Supporto del sistema operativo per SRIOV RDMA | RHEL 7.6+, Ubuntu 20.04+, SLES 15.4, WinServer 2016+ |
Supporto di Orchestrator | CycleCloud, Batch, servizio Azure Kubernetes, opzioni di configurazione del cluster |
Nota
Il supporto ufficiale a livello di kernel di AMD inizia con RHEL 8.6 e AlmaLinux 8.6, che è un derivato di RHEL.
Passaggi successivi
- Altre informazioni sull'archittetura Intel Xeon SP.
- Per informazioni sugli annunci più recenti, sugli esempi di carico di lavoro HPC e sui risultati delle prestazioni, vedere i Blog della community tecnica di Calcolo di Azure.
- Per un quadro generale sull'architettura per l'esecuzione di carichi di lavoro HPC, vedere HPC (High Performance Computing) in Azure.