Limites de limitação de computação
Aplica-se a: ✔️ VMs ✔️ Linux VMs ✔️ do Windows Conjuntos ✔️ de escala flexíveis Conjuntos de balanças uniformes
O Microsoft Compute implementa o mecanismo de limitação para ajudar no desempenho geral do serviço e oferecer uma experiência consistente aos clientes. As solicitações de API que excedem os limites máximos permitidos são limitadas e os usuários recebem um erro HTTP 429. Todas as políticas de limitação de computação são implementadas por região.
Como funcionam as políticas de limitação?
O Microsoft Compute implementa políticas de limitação que limitam o número de solicitações de API feitas por recurso e por assinatura, por região, por minuto. Se o número de solicitações de API exceder esses limites, as solicitações serão limitadas. Veja como esses limites funcionam:
Por limite de recursos – Cada recurso, como uma máquina virtual (VM), tem um limite específico para solicitações de API. Por exemplo, vamos supor que um usuário crie 10 VMs em uma assinatura. O usuário pode invocar até 12 solicitações de atualização para cada VM em um minuto. Se o usuário exceder o limite para a VM, as solicitações de API serão limitadas. Esse limite garante que alguns recursos não consumam os limites de nível de assinatura e limitem outros recursos.
Limite de assinatura – Além dos limites de recursos, há um limite abrangente no número de solicitações de API em todos os recursos de uma assinatura. Todas as solicitações de API além desse limite são limitadas, independentemente de o limite para um recurso individual ter sido atingido. Por exemplo, vamos supor que um usuário tenha 200 VMs em uma assinatura. Embora o usuário tenha o direito de iniciar até 12 solicitações de atualização de VM para cada VM, o limite agregado para solicitações de API de atualização de VM é limitado a 1500 por minuto. Todas as solicitações de API de VM de atualização para a assinatura superior a 1500 são limitadas.
Como o Microsoft Compute determina os limites de limitação?
Para determinar os limites para cada recurso e assinatura, o Microsoft Compute usa o algoritmo de bucket de token. Esse algoritmo cria buckets para cada limite e mantém um número específico de tokens em cada bucket. O número de tokens em um bucket representa o limite de limitação a qualquer minuto.
No início da janela de limitação, quando o recurso é criado, o bucket é preenchido até sua Capacidade Máxima. Cada solicitação de API iniciada pelo usuário consome um token. Quando a contagem de tokens se esgota para zero, as solicitações de API subsequentes são limitadas. O bucket é reabastecido com novos tokens a cada minuto a uma taxa consistente chamada Bucket Refill Rate para um recurso e uma assinatura.
Por exemplo: Vamos considerar a 'política de limitação para API de atualização de VM' que estipula uma taxa de recarga de bucket de quatro tokens por minuto e uma capacidade máxima de bucket de 12 tokens. O usuário invoca a solicitação Update VM API para uma máquina virtual (VM) de acordo com a tabela a seguir. Inicialmente, o bucket é preenchido com 12 tokens no início da janela de limitação. No quarto minuto, o usuário utiliza todos os 12 tokens, deixando o bucket vazio. No quinto minuto, o bucket é reabastecido com quatro novos tokens de acordo com a Bucket Refill Rate. Assim, quatro solicitações de API podem ser feitas no quinto minuto, enquanto o Microsoft Compute limita uma solicitação de API devido a tokens insuficientes.
(min) | 1º | 2º | 3º | 4º | 5º | 6º |
---|---|---|---|---|---|---|
Número de fichas no início (A) | 12 | 12 | 8 | 12 | 4 | 4 |
Pedidos por minuto (B) | 0 | 8 | 0 | 13 | 5 | 0 |
Solicitações limitadas (C) | 0 | 0 | 0 | 1 | 1 | 0 |
Tokens restantes no final do período D = Máx(A-B, 0) |
12 | 4 | 8 | 0 | 0 | 4 |
Processo semelhante é seguido para determinar os limites de limitação no nível da assinatura. As seções a seguir detalham a taxa de recarga de bucket e a capacidade máxima de bucket usadas para determinar limites de limitação para máquinas virtuais, conjuntos de escala de máquina virtual e VMs de conjunto de escala de máquinas virtuais.
Limites de limitação para máquinas virtuais
As solicitações de API para máquinas virtuais são categorizadas em sete políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API sob essa política. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respetivos limites de limitação:
Categoria de política | APIs REST | Nível de recursos | Nível de recursos | Nível de Subscrição | Nível de Subscrição |
---|---|---|---|---|---|
Taxa de recarga da caçamba (por minuto) | Capacidade máxima da caçamba (Por Min) |
Taxa de recarga da caçamba (Por Min) |
Capacidade máxima da caçamba (Por Min) |
||
Colocar VM (Criar novas VMs) |
Criar | 4 | 12 | 500 | 1500 |
Atualizar VM (Atualizar VMs existentes) |
Atualização Reaplicar Reiniciar Desligamento Iniciar Generalizar Converter em discos gerenciados Voltar a implementar Realizar Manutenção Captura Executar comando Criar ou atualizar Extensões - Atualização Extensões - Excluir Reimagem Atualização Executar comandos - Atualizar Executar comandos - Excluir Executar comandos - Criar ou atualizar |
4 | 12 | 500 | 1500 |
Excluir VM (Excluir VMs) |
Eliminar Simular despejo Desalocar |
4 | 12 | 500 | 1500 |
Baixo custo Obter VM (Obter informações sobre uma única VM) |
Obter Visualização da instância Extensões - Obter Lista de tamanhos disponíveis Recuperar dados de diagnóstico de inicialização Executar comandos - Obter por máquina virtual Executar comandos - Lista por máquina virtual |
12 | 36 | 8,000 | 24,000 |
Alto custo Obter VM1 (Obter informações sobre várias VMs) |
Lista Listar tudo Lista por localização |
ND | ND | 300 | 900 |
Comece a operação (Obter informações sobre operações assíncronas de VM) |
Status das operações assíncronas | 15 | 45 | 5.000 | 15 000 |
Operações de patch de convidado de VM (Avaliar e instalar patches de convidados) |
Avaliar patches Instalar patches |
2 | 6 | 200 | 600 |
1 Apenas as políticas de nível de subscrição são aplicáveis.
Limites de limitação para conjuntos de dimensionamento de máquinas virtuais
As solicitações de API para o Conjunto de Escala de Máquina Virtual (Uniform & Flex) são categorizadas em 5 políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API sob essa política. Essas políticas são aplicáveis aos modos de orquestração Flex e Uniforme. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respetivos limites de limitação:
Categoria de política | APIs REST | Nível de recursos | Nível de recursos | Nível de Subscrição | Nível de Subscrição |
---|---|---|---|---|---|
Taxa de recarga da caçamba (Por Min) |
Capacidade máxima da caçamba (Por Min) |
Taxa de recarga da caçamba (por minuto) | Capacidade máxima da caçamba (Por Min) |
||
Put (Criar novo conjunto de escalas) |
Criar | 4 | 12 | 125 | 375 |
Atualizar (Atualizar o conjunto de escalas existente) |
Atualização Início2 Reiniciar2 Reimplantar2 Realizar Manutenção2 Reimagem2 Recriar imagem de todos os2 Criar ou atualizar Atualizações contínuas - Cancelar Extensões - Criar Extensões - Atualização Extensões - Excluir Caminhada de domínio de atualização da plataforma Force Recovery Service Fabric Converter em grupo de posicionamento único Definir estado do serviço de orquestração |
4 | 12 | 500 | 1500 |
Delete (Excluir conjunto de escalas) |
Eliminar Desligamento2 Desalocar |
4 | 12 | 175 | 525 |
Baixo Custo Obter (Obter informações sobre o conjunto de escala única) |
Obter Lista Skus Atualizações contínuas - Obtenha as últimas novidades Obter histórico de atualização do SO |
12 | 36 | 800 | 2,400 |
Alto Custo Obter (Obtenha informações com uso intensivo de recursos) |
Obter visualização de instância Lista2 Listar todos os2 Lista por Localização2 |
10 | 30 | 360 | 1,080 |
2 Apenas as políticas de nível de subscrição são aplicáveis.
Limites de limitação para máquinas virtuais de conjunto de escala de máquinas virtuais
As solicitações de API para Máquinas Virtuais de Conjunto de Escala de Máquina Virtual são categorizadas em 3 políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API sob essa política. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respetivos limites de limitação:
Categoria de política | APIs REST | Nível de recursos | Nível de recursos | Nível de Subscrição | Nível de Subscrição |
---|---|---|---|---|---|
Taxa de recarga da caçamba (Por Min) |
Capacidade máxima da caçamba (Por Min) |
Taxa de recarga da caçamba (Por Min) |
Capacidade máxima da caçamba (Por Min) |
||
Atualizar VMs de conjunto de escala (Atualizar VMs existentes em um conjunto de escalas) |
Iniciar Recomeçar Reimagem ReimageAll Atualização Simular despejo Extensões- Criar ou atualizar RunCommands - Criar ou atualizar RunCommands - Atualização |
4 | 12 | 500 | 1500 |
Excluir VMs do conjunto de dimensionamento (Excluir VMs do conjunto de escalas) |
Eliminar Desligamento Desalocar Extensões- Excluir RunCommands - Excluir |
4 | 12 | 500 | 1500 |
Obter VMs de conjunto de escala (Obter informações sobre VMs de conjunto de escala) |
Obter Visualização GetInstance Extensões- Obter RunCommands - Obter Dados de diagnóstico RetrieveBoot |
12 | 36 | 2.000 | 6000 |
Diretrizes de solução de problemas
Caso os usuários ainda estejam enfrentando desafios devido à limitação de computação, consulte Solução de problemas de erros de limitação no Azure - Máquinas Virtuais. Ele tem detalhes sobre como solucionar problemas de limitação e práticas recomendadas para evitar ser limitado.
FAQs
Há alguma ação necessária dos usuários?
Os usuários não precisam alterar nada em suas configurações ou cargas de trabalho. Todas as APIs existentes continuam a funcionar como estão.
Quais são os benefícios das políticas de limitação?
As políticas de limitação oferecem vários benefícios:
Todos os recursos de computação têm uma janela uniforme de 1 min. Os usuários podem invocar com êxito chamadas de API, 1 minuto depois de serem limitados.
Nenhum recurso pode usar todos os limites de uma assinatura, pois os limites são definidos no nível do recurso.
A Microsoft Compute está introduzindo um novo algoritmo, o Token Bucket Algorithm, para determinar os limites. O algoritmo fornece buffer extra para os clientes, enquanto faz um grande número de solicitações de API.
O cliente recebe um alerta quando está prestes a atingir seus limites de limitação?
Como parte de cada resposta, o Microsoft Compute retorna x-ms-ratelimit-remaining-resource que pode ser usado para determinar os limites de limitação em relação às políticas. Uma lista de políticas de limitação aplicáveis é retornada como resposta aos cabeçalhos informativos da taxa de chamada.