Freigeben über


Übersicht über virtuelle Computer der HC-Serie

Gilt für: ✔️ Linux-VMs ✔️ Windows-VMs ✔️ Flexible Skalierungsgruppen ✔️ Einheitliche Skalierungsgruppen

Die Maximierung der HPC-Anwendungsleistung auf skalierbaren Intel Xeon-Prozessoren erfordert ein durchdachtes Konzept für die Prozessplatzierung in dieser neuen Architektur. In diesem Artikel wird die entsprechende Implementierung auf virtuellen Computern der HC-Serie für HPC-Anwendungen erläutert. Wir verwenden den Begriff „pNUMA“, um eine physische NUMA-Domäne zu bezeichnen, und „vNUMA“ für eine virtualisierte NUMA-Domäne. Analog dazu verwenden wir den Begriff „pCore“ für physische CPU-Kerne, während „vCore“ für virtualisierte CPU-Kerne verwendet wird.

Physisch handelt es sich bei einem Server der HC-Serie um zwei Intel Xeon Platinum 8168-CPUs mit jeweils 24 Kernen, wodurch sich eine Gesamtanzahl von 48 physischen Kernen ergibt. Jede CPU ist eine einzelne pNUMA-Domäne und hat einheitlichen Zugriff auf sechs DRAM-Kanäle. Intel Xeon Platinum-CPUs verfügen im Vergleich zu den Vorgängergenerationen über einen viermal größeren L2-Cache (256 KB/Kern -> 1 MB/Kern) sowie über einen kleineren L3-Cache im Vergleich zu früheren Intel-CPUs (2,5 MB/Kern -> 1,375 MB/Kern).

Die obige Topologie hat auch Auswirkungen auf die Hypervisorkonfiguration der HC-Serie. Damit der Azure-Hypervisor über genügend Platz verfügt, um ohne Beeinträchtigung des virtuellen Computers agieren zu können, werden die physischen Kerne 0–1 und 24–25 (also jeweils die ersten beiden physischen Kerne der Sockets) reserviert. Anschließend werden pNUMA-Domänen aller verbleibenden Kerne dem virtuellen Computer zugewiesen. Für den virtuellen Computer steht somit Folgendes zur Verfügung:

(2 vNUMA domains) * (22 cores/vNUMA) = 44 Kerne pro virtuellem Computer

Dem virtuellen Computer ist nicht bekannt, dass ihm die physischen Kerne 0–1 und 24–25 nicht zugewiesen wurden. Die einzelnen vNUMA-Instanzen werden daher so verfügbar gemacht, als stünden nativ nur 22 Kerne zur Verfügung.

Bei Intel Xeon-CPUs vom Typ Platinum, Gold und Silver wird auch ein 2D-On-Die-Meshnetzwerk für die interne und externe Kommunikation mit dem CPU-Socket eingeführt. Aus Leistungs- und Konsistenzgründen wird dringend empfohlen, Prozesse fest zuzuordnen. Eine feste Prozesszuordnung funktioniert bei virtuellen Computern der HC-Serie, da der zugrunde liegende Chip unverändert für den virtuellen Gastcomputer verfügbar gemacht wird.

Das folgende Diagramm zeigt die Trennung zwischen den Kernen, die für den Azure-Hypervisor reserviert sind, und den Kernen für den virtuellen Computer der HC-Serie:

Trennung zwischen den Kernen, die für den Azure-Hypervisor reserviert sind, und den Kernen für den virtuellen Computer der HC-Serie

Hardwarespezifikationen

Hardwarespezifikationen Virtueller Computer der HC-Serie
Kerne 44 (HT deaktiviert)
CPU Intel Xeon Platinum 8168
CPU-Frequenz (ohne AVX) 3,7 GHz (einzelner Kern), 2,7 bis 3,4 GHz (alle Kerne)
Arbeitsspeicher 8 GB/Kern (insgesamt 352 GB)
Lokaler Datenträger 700 GB SSD
InfiniBand 100 GBit EDR Mellanox ConnectX-5
Netzwerk 50-GBit-Ethernet (davon 40 GBit nutzbar); Azure-SmartNIC der zweiten Generation

Softwarespezifikationen

Softwarespezifikationen Virtueller Computer der HC-Serie
Maximale MPI-Auftragsgröße 13.200 Kerne (300 VMs in einer einzelnen VM-Skalierungsgruppe mit singlePlacementGroup=true)
MPI-Unterstützung HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI
Zusätzliche Frameworks UCX, libfabric und PGAS
Azure Storage-Unterstützung Standard- und Premium-Datenträger (maximal 4 Datenträger)
Betriebssystemunterstützung für SR-IOV/RDMA RHEL 7.6+, Ubuntu 20.04+, SLES 15.4, WinServer 2016+
Orchestratorunterstützung CycleCloud, Batch und AKS (Clusterkonfigurationsoptionen)

Hinweis

Offizielle Unterstützung auf Kernelebene von AMD ist ab RHEL 8.6 und AlmaLinux 8.6 verfügbar, einer Ableitung von RHEL.

Nächste Schritte