Übersicht über virtuelle Computer der HC-Serie
Gilt für: ✔️ Linux-VMs ✔️ Windows-VMs ✔️ Flexible Skalierungsgruppen ✔️ Einheitliche Skalierungsgruppen
Die Maximierung der HPC-Anwendungsleistung auf skalierbaren Intel Xeon-Prozessoren erfordert ein durchdachtes Konzept für die Prozessplatzierung in dieser neuen Architektur. In diesem Artikel wird die entsprechende Implementierung auf virtuellen Computern der HC-Serie für HPC-Anwendungen erläutert. Wir verwenden den Begriff „pNUMA“, um eine physische NUMA-Domäne zu bezeichnen, und „vNUMA“ für eine virtualisierte NUMA-Domäne. Analog dazu verwenden wir den Begriff „pCore“ für physische CPU-Kerne, während „vCore“ für virtualisierte CPU-Kerne verwendet wird.
Physisch handelt es sich bei einem Server der HC-Serie um zwei Intel Xeon Platinum 8168-CPUs mit jeweils 24 Kernen, wodurch sich eine Gesamtanzahl von 48 physischen Kernen ergibt. Jede CPU ist eine einzelne pNUMA-Domäne und hat einheitlichen Zugriff auf sechs DRAM-Kanäle. Intel Xeon Platinum-CPUs verfügen im Vergleich zu den Vorgängergenerationen über einen viermal größeren L2-Cache (256 KB/Kern -> 1 MB/Kern) sowie über einen kleineren L3-Cache im Vergleich zu früheren Intel-CPUs (2,5 MB/Kern -> 1,375 MB/Kern).
Die obige Topologie hat auch Auswirkungen auf die Hypervisorkonfiguration der HC-Serie. Damit der Azure-Hypervisor über genügend Platz verfügt, um ohne Beeinträchtigung des virtuellen Computers agieren zu können, werden die physischen Kerne 0–1 und 24–25 (also jeweils die ersten beiden physischen Kerne der Sockets) reserviert. Anschließend werden pNUMA-Domänen aller verbleibenden Kerne dem virtuellen Computer zugewiesen. Für den virtuellen Computer steht somit Folgendes zur Verfügung:
(2 vNUMA domains) * (22 cores/vNUMA) = 44
Kerne pro virtuellem Computer
Dem virtuellen Computer ist nicht bekannt, dass ihm die physischen Kerne 0–1 und 24–25 nicht zugewiesen wurden. Die einzelnen vNUMA-Instanzen werden daher so verfügbar gemacht, als stünden nativ nur 22 Kerne zur Verfügung.
Bei Intel Xeon-CPUs vom Typ Platinum, Gold und Silver wird auch ein 2D-On-Die-Meshnetzwerk für die interne und externe Kommunikation mit dem CPU-Socket eingeführt. Aus Leistungs- und Konsistenzgründen wird dringend empfohlen, Prozesse fest zuzuordnen. Eine feste Prozesszuordnung funktioniert bei virtuellen Computern der HC-Serie, da der zugrunde liegende Chip unverändert für den virtuellen Gastcomputer verfügbar gemacht wird.
Das folgende Diagramm zeigt die Trennung zwischen den Kernen, die für den Azure-Hypervisor reserviert sind, und den Kernen für den virtuellen Computer der HC-Serie:
Hardwarespezifikationen
Hardwarespezifikationen | Virtueller Computer der HC-Serie |
---|---|
Kerne | 44 (HT deaktiviert) |
CPU | Intel Xeon Platinum 8168 |
CPU-Frequenz (ohne AVX) | 3,7 GHz (einzelner Kern), 2,7 bis 3,4 GHz (alle Kerne) |
Arbeitsspeicher | 8 GB/Kern (insgesamt 352 GB) |
Lokaler Datenträger | 700 GB SSD |
InfiniBand | 100 GBit EDR Mellanox ConnectX-5 |
Netzwerk | 50-GBit-Ethernet (davon 40 GBit nutzbar); Azure-SmartNIC der zweiten Generation |
Softwarespezifikationen
Softwarespezifikationen | Virtueller Computer der HC-Serie |
---|---|
Maximale MPI-Auftragsgröße | 13.200 Kerne (300 VMs in einer einzelnen VM-Skalierungsgruppe mit singlePlacementGroup=true) |
MPI-Unterstützung | HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI |
Zusätzliche Frameworks | UCX, libfabric und PGAS |
Azure Storage-Unterstützung | Standard- und Premium-Datenträger (maximal 4 Datenträger) |
Betriebssystemunterstützung für SR-IOV/RDMA | RHEL 7.6+, Ubuntu 20.04+, SLES 15.4, WinServer 2016+ |
Orchestratorunterstützung | CycleCloud, Batch und AKS (Clusterkonfigurationsoptionen) |
Hinweis
Offizielle Unterstützung auf Kernelebene von AMD ist ab RHEL 8.6 und AlmaLinux 8.6 verfügbar, einer Ableitung von RHEL.
Nächste Schritte
- Weitere Informationen zur Intel Xeon-SP-Architektur.
- Informieren Sie sich über die neuesten Ankündigungen, HPC-Workloadbeispiele und Leistungsergebnisse in den Tech Community-Blogs zu Azure Compute.
- Eine allgemeinere Übersicht über die Architektur für die Ausführung von HPC-Workloads finden Sie unter High Performance Computing (HPC) in Azure.