Padrões comuns de dimensionamento automático

Concluído

Nesta unidade, analisamos padrões para dimensionamento automático.

O dimensionamento automático não é uma solução instantânea. Simplesmente adicionar recursos a um sistema ou executar mais instâncias de um processo não garante um melhor desempenho para o sistema. Ao desenhar uma estratégia de dimensionamento automático, considere os seguintes pontos:

Recomendações

Identificar gargalos: a expansão não é uma solução mágica para todos os problemas de desempenho. Por exemplo, se o banco de dados de back-end for o gargalo, não adianta adicionar mais servidores Web. Identifique e resolva os gargalos no sistema antes de lançar mais instâncias para o problema. As partes com monitorização de estado do sistema são a causa mais provável dos estrangulamentos.

Decompor cargas de trabalho por requisitos de escalabilidade: os aplicativos geralmente consistem em várias cargas de trabalho com diferentes requisitos de escala. Por exemplo, uma aplicação pode ter um site destinado ao público e um site de administração separado. O site público pode sofrer picos repentinos de tráfego, enquanto o site de administração tem uma carga menor e mais previsível.

Descarregar tarefas que consomem muitos recursos: as tarefas que exigem muitos recursos de CPU ou E/S devem ser movidas para trabalhos em segundo plano quando possível. O descarregamento de tarefas minimiza a carga no front-end que está lidando com as solicitações do usuário.

Usar recursos internos de dimensionamento automático: se o aplicativo tiver uma carga de trabalho previsível e regular, dimensione de acordo com um cronograma. Por exemplo, aumente horizontalmente durante o horário comercial. Caso contrário, se a carga de trabalho não for previsível, use métricas de desempenho, como CPU ou comprimento da fila de solicitações, para acionar o dimensionamento automático.

Considere o dimensionamento automático agressivo para cargas de trabalho críticas: para cargas de trabalho críticas, você deseja manter-se à frente da demanda. É melhor adicionar novas instâncias rapidamente sob carga pesada para lidar com o outro tráfego e, em seguida, reduzir gradualmente.

Design para dimensionamento: lembre-se de que, com a escala elástica, o aplicativo tem períodos de escala, quando as instâncias são removidas. A aplicação tem de processar graciosamente as instâncias que são removidas. Aqui estão algumas maneiras de lidar com o scale-in:

  • Ouça os eventos de desligamento quando eles estiverem disponíveis e desligue corretamente.
  • Suporte a tratamento de falhas transitórias e novas tentativas.
  • Considere dividir o trabalho para tarefas de longa duração.
  • Coloque itens de trabalho em uma fila para que outra instância possa pegar o trabalho se uma instância for removida no meio do processamento.

Notificações

  • Todas as falhas de dimensionamento automático são registradas no Registro de atividades. Em seguida, você pode configurar um alerta de registro de atividades que o notifica por e-mail, SMS (Short Message Service) ou webhooks sempre que houver uma falha de dimensionamento automático.
  • Da mesma forma, todas as ações de escala bem-sucedidas são lançadas no Registro de atividades. Em seguida, você pode configurar um alerta de registro de atividades para que possa ser notificado por e-mail, SMS ou webhooks sempre que houver uma ação de dimensionamento automático bem-sucedida. Você também pode configurar notificações por e-mail ou webhook para ser notificado sobre ações de escala bem-sucedidas por meio da guia Notificações na configuração de dimensionamento automático.

Diagrama de um fluxo de processo webhook.

Padrões comuns para dimensionar seu recurso no Azure

Dimensionamento com base na demanda

Você pode dimensionar automaticamente o número de instâncias de serviço no início do dia de trabalho, quando a demanda do cliente aumenta. No final do dia de trabalho, dimensione automaticamente o número de instâncias de aplicativos para minimizar os custos de recursos durante a noite, quando o uso do aplicativo for baixo.

Dimensionar de forma diferente durante a semana vs fins de semana

Em uma noite ou fim de semana, você pode ter menor demanda de aplicativos. Se essa carga for consistente durante um período de tempo, você poderá configurar regras de dimensionamento automático para reduzir o número de instâncias de serviço no conjunto de escala. Executar essa ação de dimensionamento reduz o custo de execução do conjunto de escalas porque você executa apenas o número de instâncias necessárias para atender à demanda atual.

Dimensionar de forma diferente durante as férias

Se você tiver um uso intenso para um serviço em determinadas partes do mês ou do ciclo fiscal, poderá dimensionar automaticamente o número de instâncias de serviço para acomodar suas demandas extras. Quando há um evento de marketing, promoção ou venda de férias, você pode dimensionar automaticamente o número de instâncias de serviço antes da demanda esperada do cliente.

Dimensionar com base em métrica personalizada

Finalmente, é melhor definir suas regras de dimensionamento automático com cuidado. Por exemplo, um ataque de negação de serviço (DoS) provavelmente resultará em um influxo em grande escala de tráfego de entrada. Tentar processar um aumento nos pedidos provocado por um ataque denial of service seria inútil e dispendioso. Estes pedidos não são genuínos e devem ser eliminados em vez de processados. Uma melhor solução é implementar a deteção e filtragem dos pedidos que ocorrem durante esse tipo de ataque antes que o mesmo atinja o seu serviço.

Depois de configurar as regras de dimensionamento automático, monitore o desempenho do seu aplicativo ao longo do tempo. Use os resultados desse monitoramento para ajustar o padrão no qual o sistema é dimensionado, se necessário.