Condividi tramite


Panoramica delle macchine virtuali serie HC

Si applica a: ✔️ macchine virtuali Linux ✔️ macchine virtuali Windows ✔️ set di scalabilità flessibili ✔️ set di scalabilità uniformi

L'ottimizzazione delle prestazioni delle applicazioni HPC nei processori scalabili Intel Xeon richiede un approccio ponderato per elaborare il posizionamento in questa nuova architettura. Di seguito viene illustrata l'implementazione di questa architettura nelle macchine virtuali della serie HC di Azure per le applicazioni HPC. Vengono usati i termini “pNUMA” per fare riferimento a un dominio NUMA fisico e “vNUMA” per fare riferimento a un dominio NUMA virtualizzato. Analogamente, verranno utilizzati i termini “pCore” per fare riferimento a core CPU fisici e “vCore” per fare riferimento ai core CPU virtualizzati.

Da un punto di vista fisico, un server serie HC consiste in una CPU EPYC 8168 con 2 * 24 core per un totale di 48 core fisici. Ogni CPU è un singolo dominio pNUMA e ha accesso unificato a sei canali di DRAM. Le CPU Intel Xeon Platinum dispongono di una cache L2 4x più grande rispetto alle generazioni precedenti (256 KB/core -> 1 MB/core) e al tempo stesso di una cache L3 più piccola rispetto alle CPU Intel precedenti (2,5 MB/core -> 1,375 MB/core).

La topologia precedente è stata usata anche per la configurazione dell'hypervisor della serie HC. Per consentire all'hypervisor di Azure di funzionare senza interferire con la macchina virtuale, si riservano i pCore 0-1 e 24-25 (ovvero i primi 2 pCore su ciascun socket). Vengono quindi assegnati domini pNUMA a tutti i core rimanenti alla macchina virtuale. Di conseguenza, la macchina virtuale visualizzerà:

(2 vNUMA domains) * (22 cores/vNUMA) = 44 core per macchina virtuale

La macchina virtuale non sa che non le sono stati assegnati i pCore 0-1 e 24-25. Espone quindi ogni vNUMA come se avesse 22 core in modo nativo.

Le CPU Intel Xeon Platinum, Gold e Silver introducono anche una rete mesh 2D on-die per la comunicazione all'interno e all'esterno del socket della CPU. È consigliabile aggiungere processi per ottenere prestazioni e coerenza ottimali. L'aggiunta dei processi funzionerà nelle macchine virtuali della serie HC perché il processore sottostante è esposto così come è alla macchina virtuale guest.

Il diagramma seguente illustra la separazione dei core riservati per Hypervisor di Azure e la macchina virtuale della serie HC.

Separazione dei core riservati per Hypervisor di Azure e macchina virtuale della serie HC

Specifiche hardware

Specifiche hardware Macchina virtuale della serie HC
Core 44 (HT disabilitato)
CPU Intel Xeon Platinum 8168
Frequenza CPU (non AVX) 3,7 GHz (core singolo), 2,7-3,4 GHz (tutti i core)
Memoria 8 GB/core (352 totale)
Disco locale SSD 700 GB
InfiniBand 100 Gb EDR Mellanox ConnectX-5
Rete Ethernet 50 Gb (utilizzabile 40 GB) SmartNIC di seconda generazione di Azure

Specifiche software

Specifiche software Macchina virtuale della serie HC
Dimensioni massime processo MPI 13200 core (300 macchine virtuali in un singolo set di scalabilità di macchine virtuali con singlePlacementGroup=true)
Supporto MPI HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI
Framework aggiuntivi UCX, libfabric, PGAS
Supporto di Archiviazione di Azure Dischi Standard e Premium (massimo 4 dischi)
Supporto del sistema operativo per SRIOV RDMA RHEL 7.6+, Ubuntu 20.04+, SLES 15.4, WinServer 2016+
Supporto di Orchestrator CycleCloud, Batch, servizio Azure Kubernetes, opzioni di configurazione del cluster

Nota

Il supporto ufficiale a livello di kernel di AMD inizia con RHEL 8.6 e AlmaLinux 8.6, che è un derivato di RHEL.

Passaggi successivi