Partilhar via


Instale drivers de GPU NVIDIA em VMs da série N executando o Windows

Aplica-se a: ✔️ Linux VMs ✔️ Windows VMs ✔️ Conjuntos de escala flexível

Para tirar partido das capacidades de GPU das VMs da série N do Azure suportadas por GPUs NVIDIA, tem de instalar controladores de GPU NVIDIA. A NVIDIA GPU Driver Extension instala drivers NVIDIA CUDA ou GRID apropriados em uma VM da série N. Instale ou gerencie a extensão usando o portal do Azure ou ferramentas como modelos do Azure PowerShell ou do Azure Resource Manager. Consulte a documentação da NVIDIA GPU Driver Extension para obter os sistemas operacionais suportados e as etapas de implantação.

Se você optar por instalar drivers NVIDIA GPU manualmente, este artigo fornece sistemas operacionais suportados, drivers e etapas de instalação e verificação. Informações de configuração manual do driver também estão disponíveis para VMs Linux.

Para obter especificações básicas, capacidades de armazenamento e detalhes do disco, consulte Tamanhos de VM GPU do Windows.

Sistemas operativos e controladores suportados

Drivers NVIDIA Tesla (CUDA)

Nota

As VMs do Azure NVads A10 v5 suportam apenas a versão de driver vGPU 16.x(536.25) ou superior. O driver vGPU para o A10 SKU é um driver unificado que suporta cargas de trabalho gráficas e de computação.

Os drivers NVIDIA Tesla (CUDA) para todas as VMs das séries NC* e ND (opcional para as séries NV) são genéricos e não específicos do Azure. Para os controladores mais recentes, visite o Web site da NVIDIA.

Gorjeta

Como alternativa à instalação manual do driver CUDA em uma VM do Windows Server, você pode implantar uma imagem da Máquina Virtual do Azure Data Science. As edições DSVM para Windows Server 2016 pré-instalam drivers NVIDIA CUDA, a CUDA Deep Neural Network Library e outras ferramentas.

Drivers NVIDIA GRID/vGPU

Nota

Para VMs do Azure NVads A10 v5, recomendamos que os clientes estejam sempre na versão mais recente do driver. A mais recente ramificação do driver principal da NVIDIA(n) é apenas compatível com a ramificação principal anterior(n-1). Por exemplo, vGPU 17.x é compatível com vGPU 16.x apenas. Qualquer VM ainda executando n-2 ou inferior pode ver falhas de driver quando a ramificação de unidade mais recente é implementada para hosts do Azure.

NVs_v3 VMs suportam apenas vGPU 16 ou versão inferior do driver.

O suporte ao Windows Server 2016 deixará de ser vGPU 17.x em diante.

A Microsoft redistribui instaladores de drivers NVIDIA GRID para VMs NV, NVv3 e NVads série A10 v5 usadas como estações de trabalho virtuais ou para aplicativos virtuais. Instale apenas esses drivers GRID em VMs da série Azure NV, somente nos sistemas operacionais listados na tabela a seguir. Esses drivers incluem o licenciamento para o software de GPU virtual GRID no Azure. Não é necessário configurar um servidor de licenças de software NVIDIA vGPU.

Os drivers GRID redistribuídos pelo Azure não funcionam em VMs da série não-NV, como as VMs das séries NCv2, NCv3, ND e NDv2. A única exceção é a série NCas_T4_V3 VM, onde os drivers GRID permitem as funcionalidades gráficas semelhantes à série NV.

A extensão Nvidia sempre instala o driver mais recente.

Para Windows 11 até e incluindo 23H2, Windows 10 até e incluindo 22H2, Server 2019/2022:

Os links a seguir para versões anteriores são fornecidos para oferecer suporte a dependências em versões de driver mais antigas.

Para Windows Server 2016 1607, 1709:

  • GRID 14.1 (512.78) (.exe) é o último driver suportado pela NVIDIA. Os 15.x mais recentes e superiores não suportam o Windows Server 2016.

Para o Windows Server 2012 R2:

Para obter links para todas as versões anteriores do driver Nvidia GRID, visite o GitHub.

Instalação do driver

  1. Conecte-se pela Área de Trabalho Remota a cada VM da série N.

  2. Transfira, extraia e instale o controlador suportado para o seu sistema operativo Windows.

Após a instalação do driver GRID em uma VM, uma reinicialização é necessária. Após a instalação do driver CUDA, uma reinicialização não é necessária.

Verificar a instalação do driver

Por favor, note que o painel de controle da Nvidia só é acessível com a instalação do driver GRID. Se você tiver instalado drivers CUDA, o painel de controle da Nvidia não estará visível.

Você pode verificar a instalação do driver no Gerenciador de dispositivos. O exemplo a seguir mostra a configuração bem-sucedida da placa Tesla K80 em uma VM NC do Azure.

Propriedades do driver da GPU

Para consultar o estado do dispositivo GPU, execute o utilitário de linha de comando nvidia-smi instalado com o driver.

  1. Abra um prompt de comando e mude para o diretório C:\Program Files\NVIDIA Corporation\NVSMI .

  2. Execute o nvidia-smi. Se o driver estiver instalado, você verá uma saída semelhante à seguinte. O GPU-Util mostra 0%, a menos que você esteja executando uma carga de trabalho de GPU na VM. A versão do driver e os detalhes da GPU podem ser diferentes dos mostrados.

Estado do dispositivo NVIDIA

Conectividade de rede RDMA

A conectividade de rede RDMA pode ser habilitada em VMs da série N compatíveis com RDMA, como NC24r, implantadas no mesmo conjunto de disponibilidade ou em um único grupo de posicionamento em um conjunto de escala de máquina virtual. A extensão HpcVmDrivers deve ser adicionada para instalar drivers de dispositivo de rede do Windows que habilitam a conectividade RDMA. Para adicionar a extensão VM a uma VM da série N habilitada para RDMA, use cmdlets do Azure PowerShell para o Azure Resource Manager.

Para instalar a extensão HpcVMDrivers da versão mais recente 1.1 em uma VM compatível com RDMA existente chamada myVM na região Oeste dos EUA:

Set-AzVMExtension -ResourceGroupName "myResourceGroup" -Location "westus" -VMName "myVM" -ExtensionName "HpcVmDrivers" -Publisher "Microsoft.HpcCompute" -Type "HpcVmDrivers" -TypeHandlerVersion "1.1"

Para obter mais informações, consulte Extensões e recursos de máquina virtual para Windows.

A rede RDMA suporta tráfego MPI (Message Passing Interface) para aplicativos executados com Microsoft MPI ou Intel MPI 5.x.

Próximos passos

  • Os desenvolvedores que criam aplicativos acelerados por GPU para as GPUs NVIDIA Tesla também podem baixar e instalar o CUDA Toolkit mais recente. Para obter mais informações, consulte o Guia de Instalação CUDA.