Visão geral de máquinas virtuais da série HB
Aplica-se a: ✔️ VMs do Linux ✔️ VMs do Windows ✔️ Conjuntos de dimensionamento flexíveis ✔️ Conjuntos de dimensionamento uniformes
A maximização do desempenho do aplicativo HPC (computação de alto desempenho) no AMD EPYC requer uma abordagem cuidadosa de localidade de memória e colocação de processo. Abaixo, descrevemos a arquitetura AMD EPYC e nossa implementação no Azure para aplicativos HPC. Usamos o termo "pNUMA" para nos referirmos a um domínio NUMA físico e "vNUMA" para nos referirmos a um domínio NUMA virtualizado.
Fisicamente, um servidor da série HB é 2 * CPUs 32-core EPYC 7551 para um total de 64 núcleos físicos. Esses 64 núcleos são divididos em 16 domínios do pNUMA (8 por soquete), cada um dos quais são quatro núcleos e conhecidos como "CPU complexa" (ou "CCX"). Cada CCX tem seu próprio cache L3, que é como um sistema operacional enxerga um limite pNUMA/vNUMA. Um par de CCXs adjacentes compartilha o acesso a dois canais de DRAM física (32 GB de DRAM em servidores da série HB).
Para fornecer espaço para o hipervisor do Azure operar sem interferir na VM, reservamos o domínio pNUMA físico 0 (o primeiro CCX). Em seguida, atribuímos domínios pNUMA 1-15 (as unidades de CCX restantes) para a VM. A VM vê:
(15 vNUMA domains) * (4 cores/vNUMA) = 60
núcleos por VM
A VM, em si, não sabe que pNUMA 0 não foi fornecido a ela. A VM compreende pNUMA 1-15 como vNUMA 0-14, com 7 vNUMA em vSocket 0 e 8 vNUMA no vSocket 1. Embora isso seja assimétrico, seu sistema operacional deve inicializar e operar normalmente. Posteriormente neste guia, instruímos a melhor forma de executar aplicativos MPI neste layout NUMA assimétrico.
A fixação do processo funcionará em VMs da série HB porque expomos o silício subjacente como está para a VM convidada. É altamente recomendável fixar o processo para desempenho e consistência ideais.
O diagrama a seguir mostra a diferenciação de núcleos reservada para o Hipervisor do Azure e a VM da série HB.
Especificações de hardware
Especificações de Hardware | VM da série HB |
---|---|
Núcleos | 60 (SMT desabilitado) |
CPU | AMD EPYC 7551 |
Frequência de CPU (não AVX) | ~ 2,55 GHz (único + todos os núcleos) |
Memória | 4 GB/núcleo (total de 240 GB) |
Disco local | SSD de 700 GB |
Infiniband | EDR Mellanox ConnectX-5 de 100 Gb |
Rede | Azure Second Gen SmartNIC com 50 GB de Ethernet (40 GB utilizáveis) |
Especificações de software
Especificações de software | VM da série HB |
---|---|
Tamanho máximo do Trabalho de MPI | 18000 núcleos (300 VMs em um único conjunto de dimensionamento de máquinas virtuais com singlePlacementGroup=true) |
Suporte a MPI | HPC-X, Intel MPI, OpenMPi, MVAPICH2, MPICH, plataforma MPI |
Estruturas adicionais | UCX, libfabric, PGAS |
Suporte do armazenamento do Azure | Discos Standard e Premium (máximo de quatro discos) |
Suporte do sistema operacional para SRIOV RDMA | RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+ |
Suporte do Orchestrator | CycleCloud, Lote, AKS; opções de configuração de cluster |
Importante
Este documento faz referência a uma versão de lançamento do Linux que está se aproximando ou em Fim da Vida Útil(EOL). Considere atualizar para uma versão mais recente.
Próximas etapas
- Saiba mais sobre arquitetura AMD EPYC e arquiteturas de vários chips. Para obter informações mais detalhadas, consulte o Guia de ajuste do HPC para processadores AMD EPYC.
- Leia informações sobre comunicados mais recentes, exemplos de cargas de trabalho de HPC e resultados de desempenho nos Blogs do programa Tech Groups da Computação do Azure.
- Para obter uma visão de nível superior da arquitetura de execução de cargas de trabalho de HPC, confira HPC (computação de alto desempenho) no Azure.