Partilhar via


Solução de problemas de falha de alocação quando você cria ou redimensiona VMs no Azure

Aplica-se a: ✔️ VMs do Linux ✔️ VMs do Windows

Quando você cria uma VM (máquina virtual), reinicia VMs paradas (desalocadas) ou redimensiona uma VM, o Microsoft Azure aloca recursos de computação para sua assinatura. Estamos continuamente investindo em infraestrutura e recursos adicionais para garantir que sempre tenhamos todos os tipos de VM disponíveis para dar suporte à demanda do cliente. No entanto, você pode enfrentar ocasionalmente falhas de alocação de recursos devido ao crescimento sem precedentes da demanda por serviços do Azure em regiões específicas. Esse problema pode ocorrer quando você tenta criar, iniciar ou redimensionar VMs em uma região, enquanto as VMs exibem o seguinte código de erro e a seguinte mensagem:

Código de erro: AllocationFailed ou ZonalAllocationFailed

Mensagem de erro: "Falha na alocação. Não temos capacidade suficiente para o tamanho de VM solicitado nesta região. Leia mais sobre como melhorar a probabilidade de sucesso de alocação em https://aka.ms/allocation-guidance"

Recomendação alternativa: quando você recebe uma recomendação alternativa, isso significa que o tamanho da VM solicitada não está disponível no momento na região ou zona selecionada. Para aumentar suas chances de alocar uma máquina virtual com sucesso, você pode selecionar uma das opções alternativas. Basta aplicar as alterações à sua seleção de entrada de VM ou redimensionar a VM existente no momento com a opção desejada e tentar iniciar ou criar a VM novamente.

Por exemplo, tente uma destas opções alternativas para melhorar a chance de sucesso da alocação:

  • Tamanhos de VM alternativos para a mesma zona e região: Standard_A2_v2, Standard_A2m_v2 ou Standard_D2a_v4
  • Zonas alternativas para o mesmo tamanho e região de VM: Zona 1 e 3

Observação

Se você estiver solucionando problemas de um VMSS (conjunto de dimensionamento de máquinas virtuais), o processo será o mesmo de uma VM padrão. Para resolver o problema, siga as instruções neste artigo.

Mensagem de erro: "Falha na alocação. Se você estiver tentando adicionar uma nova VM a um Conjunto de dimensionamento de máquinas virtuais com um único grupo de posicionamento ou atualizar/redimensionar uma VM existente em um Conjunto de dimensionamento de máquinas virtuais com um único grupo de posicionamento, observe que essa alocação tem como escopo um único cluster, e é possível que o cluster esteja sem capacidade. Leia mais sobre como melhorar a probabilidade de sucesso de alocação em http://aka.ms/allocation-guidance."

Este artigo explica as causas de algumas das falhas de alocação mais comuns e sugere possíveis correções.

Até o tipo de VM preferencial estar disponível em sua região preferida, aconselhamos que os clientes que encontrarem problemas de implantação considerem a diretriz como uma solução alternativa.

Identifique o cenário que melhor descreva seu caso e, em seguida, tente novamente a solicitação de alocação usando a solução alternativa sugerida correspondente para aumentar a probabilidade de sucesso de alocação. Como alternativa, você pode sempre tentar novamente mais tarde. Isso ocorre porque recursos suficientes podem ter sido liberados no cluster, região ou zona para acomodar a solicitação.

Use as reservas de capacidade sob demanda para garantir que a capacidade esteja sempre disponível para as suas cargas de trabalho. Essa opção permite que você reserve a capacidade de computação com antecedência, garantindo que suas VMs possam ser implantadas conforme necessário sem falhas de alocação. Essa abordagem pode melhorar a confiabilidade e a previsibilidade de suas implantações.

VM autônoma

Motivo

Se você tiver uma VM autônoma no Azure, o que significa que ela não faz parte de um conjunto de disponibilidade ou grupo de posicionamento por proximidade com outras VMs, e encontrar falhas de alocação ao tentar uma operação Criar, Iniciar ou Reimplantar, isso indica que o Azure atualmente não tem capacidade suficiente para atender à sua solicitação na região ou zona especificada.

Soluções alternativas

Para contornar esse problema, use um dos seguintes métodos:

  • Tentar a alocação novamente

    Às vezes, o problema pode ser temporário e tentar a alocação novamente após um curto período pode resolver o problema.

  • Redimensionar a VM

    Considere alterar a VM para um tamanho diferente que possa ter mais disponibilidade na região ou zona.

  • Alterar a região ou zona

    Se a região ou zona atual estiver enfrentando alta demanda, tente implantar a VM em uma região ou zona de disponibilidade diferente onde possa haver mais capacidade.

Redimensionar uma VM, adicionar VMs ou iniciar VMs parcialmente interrompidas (desalocadas) em um conjunto de disponibilidade existente

Observação

Uma VM só pode ser adicionada a um conjunto de disponibilidade durante a criação. Para adicionar uma VM existente a um conjunto de disponibilidade ou alterar o conjunto de disponibilidade de uma VM, a VM deve ser excluída e criada novamente. Para saber mais, consulte Alterar o conjunto de disponibilidade de uma VM usando o Azure PowerShell.

Motivo

A solicitação de redimensionar ou adicionar uma VM a um conjunto de disponibilidade existente deve ser feita no cluster original que hospeda esse conjunto. O cluster pode não ser compatível com o tamanho da VM solicitada ou, no momento, ter a capacidade suficiente.

A desalocação parcial significa que você parou (desalocou) uma ou mais, mas não todas, VMs em um conjunto de disponibilidade. Quando você desaloca uma VM, os recursos associados são liberados. Reiniciar as VMs em um conjunto de disponibilidade parcialmente desalocado é o mesmo que adicionar VMs a um conjunto de disponibilidade existente. Portanto, a solicitação de alocação deve ser feita no cluster original que hospeda o grupo de disponibilidade existente que pode não ter capacidade suficiente.

Soluções alternativas

Para contornar esse problema, use um dos seguintes métodos:

  • No caso da implantação de uma nova VM, se ela puder fazer parte de um conjunto de disponibilidade diferente, crie a VM em um conjunto de disponibilidade diferente (na mesma região ou zona). Essa nova VM pode ser adicionada à mesma rede virtual.

  • Considere redimensionar a VM para um tamanho diferente que possa ter mais disponibilidade na região ou zona. Para garantir que os tamanhos de VM tenham suporte em seu conjunto de disponibilidade, use conjuntos de disponibilidade – Listar Tamanhos Disponíveis – API REST.

  • Interrompa (desaloque) todas as VMs no mesmo conjunto de disponibilidade e, em seguida, inicie todas as VMs aplicáveis em um lote para permitir a alocação de todos os clusters disponíveis, em vez de apenas o cluster em que o conjunto de disponibilidade está alocado no momento.

    Para interromper todas as VMs no conjunto de disponibilidade, siga estas etapas:

    1. No portal do Azure, navegue até Máquinas virtuais.
    2. Selecione Adicionar filtro e adicione um filtro para o conjunto de disponibilidade que você deseja gerenciar.
    3. Marque a caixa para todas as VMs no conjunto de disponibilidade.
    4. Selecione Parar e aguarde a conclusão da operação e todas as VMs relatarem o status Parado (desalocado).
    5. Selecione Iniciar para alocar todas as VMs novamente.

Iniciar VMs totalmente interrompidas (desalocadas) em um conjunto de disponibilidade

Motivo

A desalocação total significa que você parou (desalocou) todas as VMs em um conjunto de disponibilidade. A solicitação de alocação para reiniciar essas VMs se destinará a todos os clusters compatíveis com o tamanho desejado dentro da região ou da zona.

Soluções alternativas

Para contornar esse problema, use um dos seguintes métodos:

  • Tentar a alocação novamente

    Às vezes, o problema pode ser temporário e tentar a alocação novamente após um curto período pode resolver o problema.

  • Redimensionar as VMs

    Considere redimensionar a VM para um tamanho diferente que possa ter mais disponibilidade na região ou zona. Para garantir que os tamanhos de VM tenham suporte em seu Conjunto de Disponibilidade, use Conjuntos de Disponibilidade – Listar Tamanhos Disponíveis – API REST.

  • Alterar a região ou zona

    Se a região ou zona atual estiver enfrentando alta demanda, tente implantar ou migrar as VMs para uma região ou zona de disponibilidade diferente onde possa haver mais capacidade.

Falhas de alocação para VMs em zonas de disponibilidade

Motivo

As zonas de disponibilidade do Azure são datacenters separados de maneira física e lógica dentro de uma região do Azure. Cada zona de disponibilidade é independente das outras, com potência, resfriamento e infraestrutura de rede próprios. Elas são projetadas para garantir alta disponibilidade e resiliência, isolando falhas em uma única zona, minimizando assim o impacto em outras zonas dentro da mesma região.

No entanto, devido às condições adicionais de restrição de implantação associadas às zonas de disponibilidade, as falhas de alocação podem ocorrer.

Soluções alternativas

Para contornar esse problema, use um dos seguintes métodos:

  • Tentar a alocação novamente

    Às vezes, repetir a solicitação de alocação mais tarde pode ajudar, pois os recursos podem ter sido liberados na zona.

  • Redimensionar a VM

    Considere redimensionar a VM para um tamanho diferente que possa ter mais disponibilidade na região ou zona.

  • Alterar a região ou zona

    Se a região ou zona atual estiver enfrentando alta demanda, tente implantar ou migrar as VMs para uma região ou zona de disponibilidade diferente onde possa haver mais capacidade. A região ou zona pode ser alterada com os seguintes métodos:

Falhas de alocação com restrições excessivas

Motivo

Quando a plataforma de Computação do Azure não pode alocar uma VM para atender às restrições necessárias especificadas na solicitação, ocorrem falhas de alocação com restrições excessivas. Essas falhas geralmente acontecem quando requisitos específicos não podem ser atendidos nos recursos disponíveis. Elas são frequentemente indicadas por erros como OverconstrainedZonalAllocationRequest ou OverconstrainedAllocationRequest.

Essas restrições geralmente (mas nem sempre) incluem os seguintes itens:

  • Tamanho da VM/SKU
  • Rede Acelerada
  • Zona de disponibilidade
  • Disco efêmero
  • PPG (grupo de posicionamento por proximidade)
  • Disco Ultra ou PremiumSSDv2

Soluções alternativas

Para contornar esse problema, use um dos seguintes métodos:

  • Tentar a alocação novamente

    Às vezes, repetir a solicitação de alocação mais tarde pode ajudar, pois os recursos podem ter sido liberados na zona.

  • Redimensionar a VM

    Considere redimensionar a VM para um tamanho diferente que possa ter mais disponibilidade na região ou zona.

  • Alterar a região ou zona

    Se a região ou zona atual estiver enfrentando alta demanda, tente implantar ou migrar as VMs para uma região ou zona de disponibilidade diferente onde possa haver mais capacidade. A região ou zona pode ser alterada com os seguintes métodos:

  • Ajuste as restrições que podem limitar a alocação: pode haver disponibilidade suficiente para o SKU da VM na zona. No entanto, as restrições definidas podem impedir a alocação. Para aumentar a probabilidade de alocação bem-sucedida, considere ajustar as restrições, fazendo o seguinte:

    • Desative a rede acelerada.
    • Remova a VM de qualquer grupo de posicionamento por proximidade.
    • Remova todos os discos UltraSSD ou PemiumSSDv2.

Falhas de alocação para VMs usando grupos de posicionamento por proximidade

Os grupos de posicionamento por proximidade garantem que os recursos sejam colocados no mesmo data center para reduzir a latência. No entanto, a restrição de implantação adicionada às vezes pode resultar em falhas de alocação. Para obter mais informações e ver práticas recomendadas, confira Grupos de posicionamento por proximidade.

Motivo

Quando solicitar iniciar ou alocar a primeira VM no grupo de posicionamento por proximidade, o data center será selecionado automaticamente. Se o tamanho necessário da VM não estiver disponível nesse data center, a solicitação falhará. Em cenários com cargas de trabalho elásticas em que as instâncias de VM são adicionadas ou removidas dinamicamente, a imposição de uma restrição de grupo de posicionamento por proximidade pode levar a uma falha de alocação, indicando que a solicitação de alocação não pode ser concluída.

Solução alternativa

Desaloque todas as VMs no grupo de posicionamento por proximidade e tente alterar a ordem em que você inicia suas VMs. Iniciar suas VMs com o SKU mais restritivo primeiro pode aumentar as chances de alocações bem-sucedidas.

Falhas de alocação para tamanhos de VM mais antigos (Av1, Dv1, DSv1, D15v2, DS15v2 etc.)

À medida que expandimos a infraestrutura do Azure, nós implantamos hardware de geração mais recente projetado para dar suporte aos tipos de máquina virtual mais recentes. Algumas das VMs de séries mais antigas não serão executadas em nossa infraestrutura de geração mais recente. Por esse motivo, os clientes podem ocasionalmente enfrentar falhas de alocação para essas SKUs herdadas. Para evitar esse problema, recomendamos que os clientes que estejam usando as máquinas virtuais de séries herdadas considerem a migração para as VMs equivalentes mais recentes, conforme recomendações a seguir. Essas VMs são otimizadas para o hardware mais recente, gerando preço e desempenho melhores.

Série/tamanho de VM herdada Série/tamanho recomendado de VM mais nova Mais informações
Série Av1 Série Av2 https://azure.microsoft.com/blog/new-av2-series-vm-sizes/
Série Dv1 ou DSv1 (D1 a D5) Série Dv3 ou DSv3 https://azure.microsoft.com/blog/introducing-the-new-dv3-and-ev3-vm-sizes/
Série Dv1 ou DSv1 (D11 a D14) Série Ev3 ou ESv3
D15v2 ou DS15v2 Considere mudar para D16v3/DS16v3 ou D32v3/DS32v3. Eles são projetados para execução em hardware de geração mais recente. Se quiser garantir que sua instância de VM esteja isolada para o hardware dedicado a um único cliente, considere a migração para os novos tamanhos de VM isolados, E64i_v3 ou E64is_v3, que são projetados para execução em hardware de geração mais recente. https://azure.microsoft.com/blog/new-isolated-vm-sizes-now-available/

Falhas de alocação para implantações grandes (mais de 500 núcleos)

Reduza o número de instâncias do tamanho de VM solicitado e repita a operação de implantação. Além disso, para implantações maiores, convém avaliar os conjunto de dimensionamento de máquinas virtuais do Azure com vários grupos de posicionamento. O número de instâncias VM pode automaticamente aumentar ou diminuir em resposta à demanda ou a um agendamento definido, e você tem uma maior probabilidade de êxito de alocação porque as implantações podem ser distribuídas em vários clusters quando implantados como um grupo de multiposicionamento. Saiba mais sobre como trabalhar com grandes conjuntos de dimensionamento de máquinas virtuais e como converter um conjunto de dimensionamento existente para abranger vários grupos de posicionamento. Observe que você pode alterar um conjunto de dimensionamento de oferecer suporte a apenas um único grupo de posicionamento para dar suporte a vários grupos de posicionamento, mas não é possível realizar uma conversão na outra direção.

Informações de plano de fundo

Como funciona a alocação

Os servidores nos datacenters do Azure são particionados em clusters. Normalmente, uma tentativa de solicitação de alocação é feita em vários clusters, mas é possível que determinadas restrições da solicitação de alocação (como tamanho da VM, Ultra SSD e grupos de posicionamento por proximidade) forcem a plataforma do Azure a repeti-la em um único cluster. O diagrama 1 a seguir ilustra o caso de uma tentativa de alocação normal feita em vários clusters.

Captura de tela do Diagrama 1 mostrando a tentativa de alocação em vários clusters.

Motivos das falhas de alocação

Quando uma alocação tem um grande número de restrições, há grandes chances de que haja falha na localização de recursos gratuitos, pois o pool de recursos disponíveis é menor. Além disso, se sua solicitação de alocação for restrita (por exemplo, ao usar grupos de posicionamento por proximidade, mas o tipo de recurso solicitado não for compatível com o conjunto de clusters e próximos), sua solicitação falhará mesmo que o cluster tenha recursos livres. O Diagrama 2 a seguir ilustra o caso em que uma alocação falha porque os clusters candidatos associados ao grupo de posicionamento por proximidade não têm recursos livres. O Diagrama 3 ilustra o caso em que uma alocação falha porque os clusters candidatos associados ao grupo de posicionamento por proximidade não dão suporte ao tamanho solicitado da VM, mesmo que os clusters tenham recursos livres.

Captura de tela do Diagrama 2 mostrando a falha na alocação sem nenhum recurso livre disponível e o Diagrama 3 mostrando a falha na alocação com tamanho não suportado.

Entre em contato conosco para obter ajuda

Se você tiver dúvidas ou precisar de ajuda, crie uma solicitação de suporte ou peça ajuda à comunidade de suporte do Azure. Você também pode enviar comentários sobre o produto para a comunidade de comentários do Azure.