Partilhar via


Particionar e atribuir GPUs a uma máquina virtual

Aplica-se a: Azure Local, versões 23H2 e 22H2

Observação

A maneira recomendada de criar e gerenciar VMs no Azure Local, versão 23H2, é usando o plano de controle Azure Arc. Use o mecanismo descrito abaixo para gerenciar suas VMs somente se precisar de funcionalidades que não estão disponíveis nas VMs do Azure Arc.

Este artigo descreve como configurar partições de unidade de processamento gráfico (GPU) e atribuir uma partição a uma máquina virtual (VM). Ele fornece instruções sobre como configurar a contagem de partições da GPU, atribuir partições da GPU e cancelar a atribuição de partições da GPU por meio do Windows Admin Center e do PowerShell.

Para provisionar o recurso de particionamento da GPU, você precisa concluir as seguintes etapas:

Pré-requisitos

Há vários requisitos e coisas a considerar antes de começar a usar o recurso de particionamento da GPU:

Pré-requisitos para o servidor host

  • Você deve ter o Windows Server 2025 instalado no servidor host. Se o clustering for necessário durante a migração ao vivo de um host de máquina virtual, o Windows Server 2025 Datacenter deverá ser instalado.

  • A função Hyper-V está instalada e configurada no seu servidor. Consulte Instalar a função Hyper-V no Windows Server para descobrir como começar.

  • Instale o dispositivo GPU físico da mesma marca, modelo e tamanho em cada servidor do cluster. Consulte a documentação fornecida pelo OEM ao instalar o dispositivo GPU em seus servidores físicos no cluster.

  • Instale os drivers de GPU em cada servidor do cluster seguindo as instruções dos IHVs da GPU. Para drivers de GPU NVIDIA, consulte a documentação NVIDIA vGPU.

  • Certifique-se de que o suporte à virtualização e a SR-IOV estejam ativados no BIOS de cada servidor no cluster. Entre em contato com o fornecedor do sistema se não conseguir identificar a configuração correta no BIOS.

  • Os hosts de cluster precisam ter processadores compatíveis com rastreamento de bits DMA da Unidade de Gerenciamento de Memória de Entrada/Saída (IOMMU). Por exemplo, processadores que suportam Intel VT-D ou AMD-Vi.

Observação

Ao migrar uma máquina virtual ao vivo com uma partição GPU atribuída, a migração ao vivo Hyper-V voltará automaticamente a utilizar TCP/IP com compactação. Isso tem o efeito potencial de aumentar a utilização da CPU de um host. Além disso, as migrações ao vivo podem levar mais tempo do que com máquinas virtuais sem partições de GPU conectadas.

Pré-requisitos para as VMs

  • Implante uma VM usando um sistema operacional convidado na lista Sistemas operacionais convidados suportados.

  • Instale os drivers da GPU na VM seguindo as instruções dos IHVs da GPU. Para drivers de GPU NVIDIA, consulte a documentação NVIDIA vGPU.

Pré-requisitos para o Windows Admin Center

Se você estiver usando o Windows Admin Center para provisionar o particionamento de GPU, deverá instalar a versão mais recente do Windows Admin Center com a extensão GPUs , versão 2.8.0 ou posterior. Para obter instruções sobre como instalar as extensões das GPUs no Centro de Administração do Windows, consulte Instalação de uma extensão.

Depois de instalar a extensão, ela aparece na guia extensões instaladas, conforme mostrado na captura de tela a seguir. Verifique se a versão da extensão GPUs é 2.8.0 ou posterior.

Captura de ecrã do separador Extensões instaladas no Windows Admin Center para verificar se a extensão GPUs está instalada.

Pré-requisitos para o PowerShell

Se você estiver usando o PowerShell para provisionar o particionamento da GPU, deverá executar todos os comandos do PowerShell como o usuário Administrador.

Para obter informações detalhadas sobre como usar comandos do PowerShell para particionamento de GPU, consulte a documentação de referência Add-VMGpuPartitionAdapter, Get-VMGpuPartitionAdaptere Remove-VMGpuPartitionAdapter documentação de referência.

Verificar a instalação do driver da GPU

Depois de concluir todos os pré-requisitos, você deve verificar se o driver da GPU está instalado e particionável.

Siga estas etapas para verificar se o driver da GPU está instalado e particionável usando o Windows Admin Center:

  1. Inicie o Windows Admin Center e verifique se a extensão GPUs já está instalada.

  2. Selecione Gestor de Cluster no menu suspenso superior e conecte-se ao seu cluster.

  3. No menu de Configurações, selecione Extensões>GPUs.

    A guia GPUs na página GPU exibe o inventário de todos os servidores e GPUs físicas instaladas em cada servidor.

  4. Verifique a coluna de status atribuído para cada GPU para todos os servidores. A coluna Estado atribuído pode ter um destes estados:

    • Pronto para a atribuição de DDA. Indica que a GPU está disponível para atribuição de DDA. Você não pode usá-lo para particionamento de GPU.

    • Particionado. Indica que a GPU é particionável.

    • Paravirtualização. Indica que a GPU tem a capacidade de driver particionado instalada, mas SR-IOV no servidor não está habilitada.

    • Não atribuível. Indica que a GPU não é atribuível porque é um dispositivo no estilo PCI ou uma porta de switch mais antigo.

      Captura de tela da guia GPUs mostrando o inventário dos servidores e seus dispositivos GPU instalados.

  5. Continue o fluxo de trabalho de particionamento de GPU apenas se a coluna Estado Atribuído mostrar Particionado para as GPUs em todos os servidores do seu cluster.

Configurar contagem de partições GPU

Cada GPU particionável vem com um conjunto de contagens de partições válidas que são predefinidas pelo seu OEM. Não é possível definir o número de partições que uma GPU pode ter. No entanto, você pode configurar a contagem de partições para qualquer uma das contagens válidas de dentro do conjunto suportado.

Siga estes passos para configurar a contagem de partições através do Windows Admin Center:

  1. Selecione a aba de partições GPU para configurar as contagens de partições. Você também pode atribuir uma partição às VMs e remover partições das VMs usando este separador.

    Observação

    Se não houver GPUs particionáveis disponíveis no cluster ou se o driver de particionamento de GPU correto não estiver instalado, a guia Partições de GPU exibirá a seguinte mensagem:

    Nenhuma GPU particionável foi encontrada. Verifique se você tem uma GPU com o driver de GPU-P correto para prosseguir.

  2. Selecione uma GPU ou uma partição de GPU para exibir os seus detalhes na secção inferior da página, em Detalhes do item selecionado. Por exemplo, se você selecionar uma GPU, ela exibirá o nome da GPU, o ID da GPU, o codificador e o decodificador disponíveis, a VRAM disponível, a contagem de partições válida e a contagem de partições atual. Se você selecionar uma partição GPU, ela exibirá o ID da partição, o ID da VM, o caminho da instância, a VRAM da partição, a codificação da partição e a decodificação da partição.

    Captura de tela da guia partições GPU mostrando o inventário dos servidores e seus dispositivos GPU instalados. A seção inferior da página exibe os detalhes do recurso selecionado.

  3. Selecione Configurar contagem de partições.

    A página Configurar contagem de partições em GPUs é exibida. Para cada servidor, ele exibe os dispositivos GPU instalados neles.

  4. Selecione um conjunto de GPUs homogêneas. Um conjunto de GPUs homogêneas é aquele que tem GPUs do mesmo tamanho, fabricante, número de modelo e número de partições. Por padrão, o Windows Admin Center seleciona automaticamente um conjunto de GPUs homogêneas se detetar uma, conforme mostrado na captura de tela a seguir:

    Captura da configuração da contagem de partições nas GPUs, exibindo o inventário de GPUs para configurar.

    Você pode ver um aviso ou um erro, dependendo das seleções feitas:

    • Atenção. Se você desmarcar uma ou mais GPUs do conjunto homogêneo de GPUs, o Windows Admin Center enviará um aviso, mas não impedirá que você prossiga. O texto de aviso indica que você não está selecionando todas as GPUs e isso pode resultar em uma contagem de partições diferente, o que não é recomendado.

      Captura de tela mostrando um aviso quando todas as GPUs dentro de um conjunto homogêneo não são selecionadas.

    • Atenção. Se nem todas as GPUs em todos os servidores tiverem a mesma configuração, o Windows Admin Center dará um aviso. Você deve selecionar manualmente as GPUs com a mesma configuração para prosseguir.

      Captura de tela mostrando um aviso quando você tem GPUs com configurações diferentes.

    • Erro. Se você selecionar GPUs com configurações diferentes, o Windows Admin Center apresentará um erro e não permitirá que você prossiga.

      Captura de tela mostrando um erro quando você seleciona GPUs com configurações diferentes.

    • Erro. Se você selecionar uma partição de GPU que já esteja atribuída a uma VM, o Windows Admin Center fornecerá um erro e não permitirá que você continue. Você deve primeiro desatribuir a partição da máquina virtual antes de prosseguir. Consulte Desatribuir uma partição de uma VM.

      Captura de tela mostrando um erro quando você seleciona uma partição que já está atribuída a uma VM.

  5. Depois de selecionar um conjunto homogéneo de GPUs, selecione, na lista suspensa Número de Partições, a contagem de partições. Esta lista preenche automaticamente as contagens de partições configuradas pelo fabricante da GPU. As contagens exibidas na lista podem variar dependendo do tipo de GPU selecionado.

    Assim que você seleciona uma contagem de partições diferente, uma dica de ferramenta aparece abaixo da lista suspensa, que exibe dinamicamente o tamanho da VRAM que cada partição recebe. Por exemplo, se a VRAM total for de 16 GB para 16 partições na GPU, alterar a contagem de partições de 16 para 8 atribui a cada partição 1,85 GB de VRAM.

    Captura de ecrã mostrando a dica de ferramenta que aparece ao selecionar uma contagem de partição diferente.

  6. Selecione Configurar contagem de partições.

    Depois de configurar a contagem de partições, o Windows Admin Center notifica que a contagem de partições está configurada com êxito e exibe a guia Partições GPU novamente. Você pode ver a nova contagem de partições para a partição GPU na coluna Contagem de partições.

Atribuir partição GPU a uma VM

Salve suas cargas de trabalho antes de atribuir partição à VM.

Observação

Atualmente, você pode atribuir apenas uma única partição GPU a uma VM. Tanto a VM quanto a partição GPU precisam estar na mesma máquina host. Recomendamos que você planeje com antecedência e determine o tamanho da partição da GPU com base nos requisitos de desempenho da carga de trabalho.

Você deve salvar suas cargas de trabalho antes de atribuir partições. Se a sua VM estiver atualmente ativada ou em execução, o Windows Admin Center desativa-a automaticamente, atribui a partição e, em seguida, ativa-a automaticamente.

  1. No separador das partições GPU, selecione + Atribuir partição.

    Captura de ecrã a mostrar o separador partições GPU com a opção Atribuir partição realçada.

    A página Atribuir partição GPU à VM é exibida.

  2. Em lista Escolha a do servidor, selecione o servidor onde a VM reside. Essa lista exibe todos os servidores do cluster.

  3. Procure e selecione a VM à qual atribuir a partição GPU. A lista preenche automaticamente as VMs que residem no servidor selecionado na etapa 2.

    • Se uma partição GPU já estiver atribuída a uma VM, essa VM aparecerá como acinzentada.

    • Selecione todas as VMs de uma só vez, marcando a caixa de seleção Selecionar Todas.

  4. Selecione as opções de VRAM disponíveis. O valor neste campo deve corresponder ao tamanho da contagem de partições que você configurou.

  5. (Opcional, mas recomendado) Marque a caixa de seleção Configurar ação offline para forçar desligamento se quiser que sua VM esteja altamente disponível e faça failover se o servidor host ficar inativo.

  6. Selecione Atribuir partição. Isto atribui a partição do tamanho da VRAM selecionado à VM selecionada no servidor anfitrião selecionado.

    Captura de tela mostrando a página Atribuir partição GPU à VM.

    Depois que a partição é atribuída, o Windows Admin Center notifica que a partição foi atribuída com êxito e exibe as partições GPU guia novamente. Na guia partições de GPU , a VM aparece na linha de partição da GPU sob o servidor em que está instalada.

Desatribuir uma partição de uma VM

Você pode cancelar a atribuição de uma partição GPU da VM se não precisar mais dela para executar suas cargas de trabalho. A desatribuição da partição libera o recurso de partição da GPU, que você pode reatribuir a outra VM mais tarde.

Você deve salvar suas cargas de trabalho antes de cancelar a atribuição de partições.

Se a sua VM estiver atualmente ativada ou em execução, o Windows Admin Center desativa-a automaticamente primeiro, desatribui a partição e, em seguida, ativa-a automaticamente.

Siga estas etapas para cancelar a atribuição de uma partição de uma VM:

  1. Na aba partições GPU, selecione a partição GPU que pretende desatribuir.

  2. Selecione - Cancelar atribuição de partição.

    Captura de tela mostrando a guia partições da GPU com a opção Cancelar atribuição de partição realçada.

    A página Remover partição de GPU da máquina virtual é exibida.

  3. Em lista Escolha a do servidor, selecione o servidor que tem a partição GPU que você deseja desatribuir.

  4. Em , escolha a máquina virtual a partir da lista, pesquise ou selecione a VM para a qual deseja cancelar a atribuição da partição.

  5. Selecione Cancelar atribuição de partição.

    Captura de tela mostrando a página Cancelar atribuição de partição GPU da VM.

    Depois que a partição for desatribuída, o Windows Admin Center notifica que a partição foi desatribuída com êxito e exibe novamente o separador partições GPU. Na guia de partições de GPU , a VM à qual a partição foi desatribuída já não é exibida na linha de partição da GPU.