Descrição geral das máquinas virtuais da série HC
Aplica-se a: ✔️ VMs ✔️ Linux VMs ✔️ do Windows Conjuntos ✔️ de escala flexíveis Conjuntos de balanças uniformes
Maximizar o desempenho do aplicativo HPC nos processadores escaláveis Intel Xeon requer uma abordagem cuidadosa para o posicionamento do processo nesta nova arquitetura. Aqui, descrevemos nossa implementação em VMs da série HC do Azure para aplicativos HPC. Usaremos o termo "pNUMA" para nos referirmos a um domínio NUMA físico e "vNUMA" para nos referirmos a um domínio NUMA virtualizado. Da mesma forma, usaremos o termo "pCore" para nos referirmos a núcleos de CPU físicos, e "vCore" para nos referirmos a núcleos de CPU virtualizados.
Fisicamente, um servidor da série HC é 2 * 24-core Intel Xeon Platinum 8168 CPUs para um total de 48 núcleos físicos. Cada CPU é um único domínio pNUMA e tem acesso unificado a seis canais de DRAM. As CPUs Intel Xeon Platinum apresentam um cache L2 4x maior do que nas gerações anteriores (256 KB/core -> 1 MB/core), além de reduzir o cache L3 em comparação com as CPUs Intel anteriores (2,5 MB/core -> 1,375 MB/core).
A topologia acima também é transferida para a configuração do hipervisor da série HC. Para fornecer espaço para o hipervisor do Azure operar sem interferir com a VM, reservamos pCores 0-1 e 24-25 (ou seja, os primeiros 2 pCores em cada soquete). Em seguida, atribuímos domínios pNUMA a todos os núcleos restantes à VM. Assim, o VM verá:
(2 vNUMA domains) * (22 cores/vNUMA) = 44
núcleos por VM
A VM não tem conhecimento de que os pCores 0-1 e 24-25 não lhe foram dados. Assim, expõe cada vNUMA como se tivesse nativamente 22 núcleos.
As CPUs Intel Xeon Platinum, Gold e Silver também introduzem uma rede mesh 2D on-die para comunicação dentro e fora do soquete da CPU. Recomendamos vivamente a fixação do processo para um desempenho e consistência ideais. A fixação de processo funcionará em VMs da série HC porque o silício subjacente é exposto como está para a VM convidada.
O diagrama a seguir mostra a segregação de núcleos reservados para o Hipervisor do Azure e a VM da série HC.
Especificações de hardware
Especificações de hardware | VM série HC |
---|---|
Núcleos | 44 (HT desativado) |
CPU | Intel Xeon Platina 8168 |
Freqüência da CPU (não-AVX) | 3,7 GHz (núcleo único), 2,7-3,4 GHz (todos os núcleos) |
Memória | 8 GB/núcleo (352 no total) |
Disco Local | SSD de 700 GB |
Infiniband | 100 Gb EDR Mellanox ConnectX-5 |
Rede | Ethernet de 50 Gb (40 Gb utilizável) SmartNIC de segunda geração do Azure |
Especificações de software
Especificações de software | VM série HC |
---|---|
Tamanho máximo do trabalho MPI | 13200 núcleos (300 VMs em um único conjunto de escala de máquina virtual com singlePlacementGroup=true) |
Suporte MPI | HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Plataforma MPI |
Estruturas adicionais | UCX, libfabric, PGAS |
Suporte de armazenamento do Azure | Discos Standard e Premium (máximo 4 discos) |
Suporte de SO para SRIOV RDMA | RHEL 7.6+, Ubuntu 20.04+, SLES 15.4, WinServer 2016+ |
Suporte ao Orchestrator | CycleCloud, Batch, AKS; Opções de configuração de cluster |
Nota
O suporte oficial em nível de kernel da AMD começa com RHEL 8.6 e AlmaLinux 8.6, que é um derivado do RHEL.
Próximos passos
- Saiba mais sobre a arquitetura Intel Xeon SP.
- Leia sobre os anúncios mais recentes, exemplos de carga de trabalho HPC e resultados de desempenho nos Blogs da Comunidade de Tecnologia de Computação do Azure.
- Para obter uma exibição de arquitetura de nível superior da execução de cargas de trabalho HPC, consulte Computação de alto desempenho (HPC) no Azure.