Översikt över virtuella datorer i HC-serien
Gäller för: ✔️ Virtuella Linux-datorer ✔️ med virtuella Windows-datorer ✔️ – flexibla skalningsuppsättningar ✔️ Enhetliga skalningsuppsättningar
För att maximera HPC-programprestanda på Intel Xeon Scalable Processors krävs en genomtänkt metod för att bearbeta placering på den nya arkitekturen. Här beskriver vi implementeringen av den på virtuella datorer i Azure HC-serien för HPC-program. Vi använder termen "pNUMA" för att referera till en fysisk NUMA-domän och "vNUMA" för att referera till en virtualiserad NUMA-domän. På samma sätt använder vi termen "pCore" för att referera till fysiska CPU-kärnor och "virtuell kärna" för att referera till virtualiserade CPU-kärnor.
Fysiskt är en HC-serieserver 2 * 24-kärnigt Intel Xeon Platinum 8168-processorer för totalt 48 fysiska kärnor. Varje CPU är en enda pNUMA-domän och har enhetlig åtkomst till sex kanaler med DRAM. Intel Xeon Platinum-processorer har en 4x större L2-cache än i tidigare generationer (256 kB/kärna –> 1 MB/kärna), samtidigt som L3-cachen minskar jämfört med tidigare Intel-processorer (2,5 MB/kärna –> 1,375 MB/kärna).
Topologin ovan överförs även till HC-seriens hypervisor-konfiguration. För att ge utrymme för Azure-hypervisor-programmet att fungera utan att störa den virtuella datorn reserverar vi pCores 0-1 och 24-25 (d.v.s. de första 2 pCores på varje socket). Sedan tilldelar vi pNUMA-domäner alla återstående kärnor till den virtuella datorn. Den virtuella datorn kommer därför att se:
(2 vNUMA domains) * (22 cores/vNUMA) = 44
kärnor per virtuell dator
Den virtuella datorn har ingen kunskap om att pCores 0-1 och 24-25 inte gavs till den. Därför exponeras varje vNUMA som om den internt hade 22 kärnor.
Intel Xeon Platinum-, Gold- och Silver-processorer introducerar också ett 2D-nätnätverk på tärning för kommunikation inom och utanför CPU-socketen. Vi rekommenderar starkt att du fäster processen för optimal prestanda och konsekvens. Processfästning fungerar på virtuella datorer i HC-serien eftersom det underliggande kiselet exponeras i befintligt fall för den virtuella gästdatorn.
Följande diagram visar uppdelningen av kärnor som är reserverade för Azure Hypervisor och den virtuella datorn i HC-serien.
Maskinvaruspecifikationer
Maskinvaruspecifikationer | Virtuell dator i HC-serien |
---|---|
Kärnor | 44 (HT inaktiverad) |
Processor | Intel Xeon Platinum 8168 |
CPU-frekvens (icke-AVX) | 3,7 GHz (en kärna), 2,7–3,4 GHz (alla kärnor) |
Minne | 8 GB/kärna (totalt 352) |
Lokal disk | 700 GB SSD |
Infiniband | 100 Gb EDR Mellanox ConnectX-5 |
Nätverk | 50 Gb Ethernet (40 Gb användbart) Azure second Gen SmartNIC |
Programvaruspecifikationer
Programvaruspecifikationer | Virtuell dator i HC-serien |
---|---|
Maximal MPI-jobbstorlek | 13200 kärnor (300 virtuella datorer i en enda VM-skalningsuppsättning med singlePlacementGroup=true) |
MPI-support | HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI |
Ytterligare ramverk | UCX, libfabric, PGAS |
Stöd för Azure Storage | Standard- och Premium-diskar (högst 4 diskar) |
OS-stöd för SRIOV RDMA | RHEL 7.6+, Ubuntu 20.04+, SLES 15.4, WinServer 2016+ |
Stöd för Orchestrator | CycleCloud, Batch, AKS; konfigurationsalternativ för kluster |
Kommentar
Officiellt stöd på kernelnivå från AMD börjar med RHEL 8.6 och AlmaLinux 8.6, som är ett derivat av RHEL.
Nästa steg
- Läs mer om Intel Xeon SP-arkitektur.
- Läs om de senaste meddelandena, HPC-arbetsbelastningsexempel och prestandaresultat på Azure Compute Tech Community-bloggarna.
- En arkitekturvy på högre nivå för att köra HPC-arbetsbelastningar finns i HPC (High Performance Computing) på Azure.