Série de tamanho ND-H100-v5
A máquina virtual (VM) da série ND H100 v5 é o novo carro-chefe da família de GPUs do Azure. Esta série é projetada para treinamentos avançados de Deep Learning e cargas de trabalho de IA generativa e HPC de expansão e escalonamento vertical fortemente acopladas.
A série ND H100 v5 começa com uma só VM e oito GPUs NVIDIA H100 Tensor Core. As implantações baseadas na série ND H100 v5 podem realizar o escalonamento vertical para milhares de GPUs com 3,2 Tbps de largura de banda de interconexão por VM. Cada GPU na VM é fornecida com a própria conexão NVIDIA Quantum-2 CX7 InfiniBand de 400 Gb/s dedicada e independente de topologia. Essas conexões são configuradas automaticamente entre as VMs que ocupam o mesmo conjunto de dimensionamento de máquinas virtuais e dão suporte à GPU Direct RDMA.
Cada GPU apresenta conectividade NVLINK 4.0 para a comunicação na VM, e a instância tem 96 núcleos físicos de processador Intel Xeon Scalable de quarta geração.
Essas instâncias fornecem um excelente desempenho para muitas ferramentas de IA, ML e análise que dão suporte à aceleração de GPU "pronta para uso", como o TensorFlow, o Pytorch, o Caffe, o RAPIDS e outras estruturas. Além disso, a interconexão InfiniBand de expansão dá suporte a um grande conjunto de ferramentas existentes de IA e do HPC criadas nas bibliotecas de comunicação NCCL da NVIDIA para o clustering contínuo de GPUs.
Especificações do host
Parte | Quantidade Unidades de Contagem |
Especificações ID SKU, unidades de desempenho, etc. |
---|---|---|
Processador | 96 vCPUs | Intel Xeon (Sapphire Rapids) [x86-64] |
Memória | 1.900 GiB | |
Armazenamento local | 1 disco | 28.000 GiB |
Armazenamento Remoto | 32Discos | |
Rede | 8 NICs | |
Aceleradores | 8 GPUs | GPU Nvidia H100 (80 GB) |
Suporte a recursos
Armazenamento Premium: com suporte
Cache com Armazenamento Premium: com suporte
Migração dinâmica: sem suporte
Atualizações de preservação de memória: sem suporte
VMs de geração 2: com suporte
VMs de geração 1: sem suporte
Rede Acelerada: com suporte
Discos de SO efêmero: aceitos
Virtualização aninhada: sem suporte
InfiniBand: com suporte
Importante
Para começar a usar as VMs da série ND H100 v5, confira a Configuração e otimização de carga de trabalho do HPC para ver as etapas, incluindo a configuração do driver e da rede. Devido ao aumento de volume de E/S da memória da GPU, a ND H100 v5 requer o uso de VMs de Geração 2 e imagens do marketplace.
O Azure dá suporte ao Ubuntu 20.04/22.04, RHEL 7.9/8.7/9.3, AlmaLinux 8.8/9.2 e SLES 15 para VMs ND H100 v5. Atualmente, há suporte para imagens de VM Ubuntu-HPC 20.4/22.04 e AlmaLinux-HPC 8.6/8.7.
Há ofertas de imagens de VM do Linux otimizadas e pré-configuradas para cargas de trabalho de HPC/IA com uma variedade de ferramentas e bibliotecas de HPC instaladas e, portanto, são altamente recomendadas.
Para baixar uma imagem, acesse o Azure Marketplace.
Tamanhos em série
vCPUs (Qtd.) e memória para cada tamanho
Tamanho do Nome | vCPUs (Qty.) | Memória (GB) |
---|---|---|
Standard_ND96isr_H100_v5 | 96 | 1900 |
Recursos Básicos da VM
Outras informações de tamanho
Lista de todos os tamanhos disponíveis: Tamanhos
Calculadora de Preços: Calculadora de Preços
Informações sobre os tipos de disco: Tipos de Disco
Próximas etapas
Saiba mais sobre como as ACUs (unidade de computação do Azure) podem ajudar você a comparar o desempenho de computação entre SKUs do Azure.
Confira Hosts Dedicados do Azure para servidores físicos com capacidade para hospedar uma ou mais máquinas virtuais atribuídas a uma assinatura do Azure.
Saiba como Monitorar as máquinas virtuais do Azure.