Criar uma máquina virtual acelerada por GPU
A nuvem do Microsoft Azure oferece muitos tamanhos de máquina virtual (VM) com vários recursos. Os tamanhos de VM otimizados para GPU são máquinas virtuais especializadas disponíveis com GPUs únicas, múltiplas ou fracionárias. Esses tamanhos são projetados para cargas de trabalho intensivas em computação, gráficos e visualização. Nesta seção, implantamos uma máquina virtual acelerada por GPU para hospedar uma instalação do NVIDIA Triton Inference Server.
Criar uma máquina virtual acelerada por GPU
Nota
Dependendo da configuração da sua Assinatura do Azure, você pode não ter a capacidade de implantar uma Máquina Virtual acelerada por GPU. Se esse for o caso, você ainda pode continuar com este módulo implantando qualquer máquina virtual baseada em CPU.
Entre no portal do Azure e selecione Criar um recurso no menu suspenso à esquerda.
Na tela resultante, procure a seção de máquina virtual e selecione criar.
Na seção Noções básicas:
Criar um novo grupo de recursos.
Forneça um nome de máquina virtual que seja globalmente exclusivo.
Escolha uma região apropriada.
Deixe as opções de Disponibilidade na configuração padrão. Não é necessária redundância de infraestrutura.
Deixe Tipo de segurança na configuração padrão, Padrão.
Em Imagem , selecione Configurar geração de VM, selecione Geração 1 e Aplicar.
- Em seguida, selecione Ubuntu Server 18.04 LTS - Gen1 na seção Imagem .
Deixe a instância do Azure Spot desmarcada.
Para Tamanho, se você deseja usar uma instância de CPU, deixe essa opção como está, para selecionar uma oferta acelerada por GPU, selecione a opção Ver todos os tamanhos .
Para ver as ofertas de GPU disponíveis na sua subscrição, selecione Adicionar filtro , selecione Família e, em seguida, selecione apenas a opção GPU e a lista de atualizações.
Selecione uma opção apropriada da série N em Tamanhos de VM de armazenamento não premium. Sugerimos NC6. Em seguida, escolha Selecionar.
Na seção Conta de administrador, selecione Senha.
Neste ponto, as opções selecionadas devem se parecer com a imagem a seguir.
Forneça um nome de usuário e senha para a conta de administrador.
Na seção Regras de porta de entrada, selecione Permitir portas selecionadas e verifique se Selecionar portas de entrada mostra que SSH (22) está habilitado.
As opções restantes devem se parecer com a imagem a seguir. Quando verificar se as opções estão corretas, selecione Rever + criar.
A implantação cria vários recursos: a máquina virtual, um grupo de segurança de rede e um endereço IP público. Quando o provisionamento estiver concluído, selecione o botão Ir para o recurso ou navegue até sua máquina virtual usando o portal do Azure.
Na tela Visão geral da máquina virtual, copie o endereço IP público e salve esse valor no editor de texto de sua escolha. Usamos esse valor para acessar a máquina virtual por meio de um emulador de terminal, como TeraTerm ou Terminal Windows.