Limites de limitação de computação

Como funcionam as políticas de limitação?

Como o Microsoft Compute determina os limites de limitação?

Limites de limitação para máquinas virtuais

Limites de limitação para conjuntos de dimensionamento de máquinas virtuais

Limites de limitação para máquinas virtuais de conjunto de escala de máquinas virtuais

Diretrizes de solução de problemas

FAQs

Há alguma ação necessária dos usuários?

Quais são os benefícios das políticas de limitação?

O cliente recebe um alerta quando está prestes a atingir seus limites de limitação?

Partilhar via

Artigo
08/25/2024

Aplica-se a: ✔️ VMs ✔️ Linux VMs ✔️ do Windows Conjuntos ✔️ de escala flexíveis Conjuntos de balanças uniformes

O Microsoft Compute implementa o mecanismo de limitação para ajudar no desempenho geral do serviço e oferecer uma experiência consistente aos clientes. As solicitações de API que excedem os limites máximos permitidos são limitadas e os usuários recebem um erro HTTP 429. Todas as políticas de limitação de computação são implementadas por região.

O Microsoft Compute implementa políticas de limitação que limitam o número de solicitações de API feitas por recurso e por assinatura, por região, por minuto. Se o número de solicitações de API exceder esses limites, as solicitações serão limitadas. Veja como esses limites funcionam:

Por limite de recursos – Cada recurso, como uma máquina virtual (VM), tem um limite específico para solicitações de API. Por exemplo, vamos supor que um usuário crie 10 VMs em uma assinatura. O usuário pode invocar até 12 solicitações de atualização para cada VM em um minuto. Se o usuário exceder o limite para a VM, as solicitações de API serão limitadas. Esse limite garante que alguns recursos não consumam os limites de nível de assinatura e limitem outros recursos.
Limite de assinatura – Além dos limites de recursos, há um limite abrangente no número de solicitações de API em todos os recursos de uma assinatura. Todas as solicitações de API além desse limite são limitadas, independentemente de o limite para um recurso individual ter sido atingido. Por exemplo, vamos supor que um usuário tenha 200 VMs em uma assinatura. Embora o usuário tenha o direito de iniciar até 12 solicitações de atualização de VM para cada VM, o limite agregado para solicitações de API de atualização de VM é limitado a 1500 por minuto. Todas as solicitações de API de VM de atualização para a assinatura superior a 1500 são limitadas.

Para determinar os limites para cada recurso e assinatura, o Microsoft Compute usa o algoritmo de bucket de token. Esse algoritmo cria buckets para cada limite e mantém um número específico de tokens em cada bucket. O número de tokens em um bucket representa o limite de limitação a qualquer minuto.

No início da janela de limitação, quando o recurso é criado, o bucket é preenchido até sua Capacidade Máxima. Cada solicitação de API iniciada pelo usuário consome um token. Quando a contagem de tokens se esgota para zero, as solicitações de API subsequentes são limitadas. O bucket é reabastecido com novos tokens a cada minuto a uma taxa consistente chamada Bucket Refill Rate para um recurso e uma assinatura.

Por exemplo: Vamos considerar a 'política de limitação para API de atualização de VM' que estipula uma taxa de recarga de bucket de quatro tokens por minuto e uma capacidade máxima de bucket de 12 tokens. O usuário invoca a solicitação Update VM API para uma máquina virtual (VM) de acordo com a tabela a seguir. Inicialmente, o bucket é preenchido com 12 tokens no início da janela de limitação. No quarto minuto, o usuário utiliza todos os 12 tokens, deixando o bucket vazio. No quinto minuto, o bucket é reabastecido com quatro novos tokens de acordo com a Bucket Refill Rate. Assim, quatro solicitações de API podem ser feitas no quinto minuto, enquanto o Microsoft Compute limita uma solicitação de API devido a tokens insuficientes.

Processo semelhante é seguido para determinar os limites de limitação no nível da assinatura. As seções a seguir detalham a taxa de recarga de bucket e a capacidade máxima de bucket usadas para determinar limites de limitação para máquinas virtuais, conjuntos de escala de máquina virtual e VMs de conjunto de escala de máquinas virtuais.

As solicitações de API para máquinas virtuais são categorizadas em sete políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API sob essa política. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respetivos limites de limitação:

Categoria de política	APIs REST	Nível de recursos	Nível de recursos	Nível de Subscrição	Nível de Subscrição
		Taxa de recarga da caçamba (por minuto)	Capacidade máxima da caçamba (Por Min)	Taxa de recarga da caçamba (Por Min)	Capacidade máxima da caçamba (Por Min)
Colocar VM (Criar novas VMs)	Criar	4	12	500	1500
Atualizar VM (Atualizar VMs existentes)	Atualização Reaplicar Reiniciar Desligamento Iniciar Generalizar Converter em discos gerenciados Voltar a implementar Realizar Manutenção Captura Executar comando Criar ou atualizar Extensões - Atualização Extensões - Excluir Reimagem Atualização Executar comandos - Atualizar Executar comandos - Excluir Executar comandos - Criar ou atualizar	4	12	500	1500
Excluir VM (Excluir VMs)	Eliminar Simular despejo Desalocar	4	12	500	1500
Baixo custo Obter VM (Obter informações sobre uma única VM)	Obter Visualização da instância Extensões - Obter Lista de tamanhos disponíveis Recuperar dados de diagnóstico de inicialização Executar comandos - Obter por máquina virtual Executar comandos - Lista por máquina virtual	12	36	8,000	24,000
Alto custo Obter VM¹ (Obter informações sobre várias VMs)	Lista Listar tudo Lista por localização	ND	ND	300	900
Comece a operação (Obter informações sobre operações assíncronas de VM)	Status das operações assíncronas	15	45	5.000	15 000
Operações de patch de convidado de VM (Avaliar e instalar patches de convidados)	Avaliar patches Instalar patches	2	6	200	600

1 Apenas as políticas de nível de subscrição são aplicáveis.

As solicitações de API para o Conjunto de Escala de Máquina Virtual (Uniform & Flex) são categorizadas em 5 políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API sob essa política. Essas políticas são aplicáveis aos modos de orquestração Flex e Uniforme. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respetivos limites de limitação:

Categoria de política	APIs REST	Nível de recursos	Nível de recursos	Nível de Subscrição	Nível de Subscrição
		Taxa de recarga da caçamba (Por Min)	Capacidade máxima da caçamba (Por Min)	Taxa de recarga da caçamba (por minuto)	Capacidade máxima da caçamba (Por Min)
Put (Criar novo conjunto de escalas)	Criar	4	12	125	375
Atualizar (Atualizar o conjunto de escalas existente)	Atualização Início² Reiniciar² Reimplantar² Realizar Manutenção² Reimagem² Recriar imagem de todos os² Criar ou atualizar Atualizações contínuas - Cancelar Extensões - Criar Extensões - Atualização Extensões - Excluir Caminhada de domínio de atualização da plataforma Force Recovery Service Fabric Converter em grupo de posicionamento único Definir estado do serviço de orquestração	4	12	500	1500
Delete (Excluir conjunto de escalas)	Eliminar Desligamento² Desalocar	4	12	175	525
Baixo Custo Obter (Obter informações sobre o conjunto de escala única)	Obter Lista Skus Atualizações contínuas - Obtenha as últimas novidades Obter histórico de atualização do SO	12	36	800	2,400
Alto Custo Obter (Obtenha informações com uso intensivo de recursos)	Obter visualização de instância Lista² Listar todos os² Lista por Localização²	10	30	360	1,080

2 Apenas as políticas de nível de subscrição são aplicáveis.

As solicitações de API para Máquinas Virtuais de Conjunto de Escala de Máquina Virtual são categorizadas em 3 políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API sob essa política. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respetivos limites de limitação:

Categoria de política	APIs REST	Nível de recursos	Nível de recursos	Nível de Subscrição	Nível de Subscrição
		Taxa de recarga da caçamba (Por Min)	Capacidade máxima da caçamba (Por Min)	Taxa de recarga da caçamba (Por Min)	Capacidade máxima da caçamba (Por Min)
Atualizar VMs de conjunto de escala (Atualizar VMs existentes em um conjunto de escalas)	Iniciar Recomeçar Reimagem ReimageAll Atualização Simular despejo Extensões- Criar ou atualizar RunCommands - Criar ou atualizar RunCommands - Atualização	4	12	500	1500
Excluir VMs do conjunto de dimensionamento (Excluir VMs do conjunto de escalas)	Eliminar Desligamento Desalocar Extensões- Excluir RunCommands - Excluir	4	12	500	1500
Obter VMs de conjunto de escala (Obter informações sobre VMs de conjunto de escala)	Obter Visualização GetInstance Extensões- Obter RunCommands - Obter Dados de diagnóstico RetrieveBoot	12	36	2.000	6000

Caso os usuários ainda estejam enfrentando desafios devido à limitação de computação, consulte Solução de problemas de erros de limitação no Azure - Máquinas Virtuais. Ele tem detalhes sobre como solucionar problemas de limitação e práticas recomendadas para evitar ser limitado.

Os usuários não precisam alterar nada em suas configurações ou cargas de trabalho. Todas as APIs existentes continuam a funcionar como estão.

As políticas de limitação oferecem vários benefícios:

Todos os recursos de computação têm uma janela uniforme de 1 min. Os usuários podem invocar com êxito chamadas de API, 1 minuto depois de serem limitados.
Nenhum recurso pode usar todos os limites de uma assinatura, pois os limites são definidos no nível do recurso.
A Microsoft Compute está introduzindo um novo algoritmo, o Token Bucket Algorithm, para determinar os limites. O algoritmo fornece buffer extra para os clientes, enquanto faz um grande número de solicitações de API.

Como parte de cada resposta, o Microsoft Compute retorna x-ms-ratelimit-remaining-resource que pode ser usado para determinar os limites de limitação em relação às políticas. Uma lista de políticas de limitação aplicáveis é retornada como resposta aos cabeçalhos informativos da taxa de chamada.

Número de fichas no início (A)

Pedidos por minuto (B)

Solicitações limitadas (C)

Tokens restantes no final do período
D = Máx(A-B, 0)