Recomendações para a recolha de dados de desempenho
Aplica-se a esta recomendação da lista de verificação de Eficiência de Desempenho do Azure Well-Architected Framework:
PE:04 | Colete dados de desempenho. Os componentes e fluxos de carga de trabalho devem fornecer métricas e logs automáticos, contínuos e significativos. Colete dados em diferentes níveis da carga de trabalho, como os níveis de aplicativo, plataforma, dados e sistema operacional. |
---|
A coleta de dados de desempenho é o processo de coleta de métricas e logs que fornecem informações sobre o desempenho de uma carga de trabalho. Esses dados incluem valores numéricos, que são conhecidos como métricas. As métricas descrevem o estado do sistema em um determinado momento. Ele também inclui logs que contêm diferentes tipos de dados organizados em registros.
Ao coletar dados de desempenho, você pode monitorar e analisar o desempenho de uma carga de trabalho. Você pode usar essas informações para identificar gargalos de desempenho, solucionar problemas, otimizar a alocação de recursos e tomar decisões orientadas por dados para melhorar a eficiência geral de desempenho da carga de trabalho.
Sem insights orientados por dados, você pode não estar ciente de problemas de desempenho subjacentes ou oportunidades de otimização. Os resultados potenciais incluem tempos de resposta mais lentos, menor taxa de transferência, maior uso de recursos e, finalmente, uma experiência de usuário abaixo do ideal. Além disso, a falta de dados de desempenho dificulta o diagnóstico e a solução de problemas em tempo hábil, levando a um tempo de inatividade prolongado e à redução da produtividade.
Definições
Termo | Definição |
---|---|
Registos de atividade | Logs que rastreiam operações de gerenciamento em recursos, como a exclusão de um recurso. |
Registos de aplicações | Logs que rastreiam informações sobre eventos de aplicativos, erros e outras atividades, como entradas de uso e falhas de conexão de banco de dados. |
Ferramenta de monitoramento de desempenho de aplicativos (APM) | Uma ferramenta que monitora e relata o desempenho de um aplicativo. |
Instrumentação de código | A captura direta ou indireta de métricas de desempenho da perspetiva do código do aplicativo. As métricas capturadas incluem métricas de fluxo, uso de recursos e métricas específicas para a linguagem ou tempo de execução. |
Rastreio distribuído | Coleta e correlação de métricas entre componentes de carga de trabalho distribuída. |
Afundamento de métricas | Um destino de armazenamento para suas métricas que correlaciona dados de séries temporais para análise. |
Registos da plataforma | Dados de diagnóstico e auditoria que incluem logs de recursos, logs de atividades e logs de auditoria. |
Métricas de plataforma | Valores numéricos que registram o desempenho da carga de trabalho em um determinado momento. |
Registos do recurso | Dados que um sistema gera. Fornece informações sobre o estado do sistema. |
Erros Rx/Tx | O número de erros de receção e transmissão de erros em uma interface de rede. |
Registos estruturados | Definição de um formato significativo para registrar mensagens, normalmente como pares chave-valor. |
Principais estratégias de design
A otimização de desempenho requer dados para medir o desempenho atual de uma carga de trabalho ou de um fluxo em relação às suas metas de desempenho. Você precisa coletar a quantidade certa e a diversidade de dados para medir o desempenho do código e da infraestrutura em relação às metas de desempenho. Certifique-se de que cada componente e fluxo dentro da carga de trabalho gere automaticamente métricas e logs contínuos e significativos. Você precisa obter esses dados de diversos níveis, como o aplicativo, a plataforma, o armazenamento e o sistema operacional. A recolha abrangente de dados sobre o desempenho permite uma compreensão holística do desempenho, permitindo a identificação precisa de ineficiências e vias de melhoria.
Centralize a coleta de dados de desempenho
Centralizar métricas e logs de desempenho é o processo de coletar métricas de desempenho e logs de várias fontes e armazená-los em um local central. Crie um coletor de métricas central e um coletor de log central. Essa centralização permite fácil acesso, análise e monitoramento de métricas e logs de desempenho em diferentes sistemas e componentes. Ao centralizar métricas e logs, você ganha visibilidade sobre o desempenho de sua carga de trabalho. Escolha uma plataforma ou ferramenta adequada que possa agregar e armazenar métricas e logs de desempenho da carga de trabalho.
Compensação: entenda o custo da coleta de métricas e logs. Em geral, quanto mais métricas e logs você coletar, maior será o custo.
Dados de desempenho do segmento
A segmentação de dados de desempenho envolve a organização e categorização de métricas e logs com base em sua origem, finalidade ou ambiente. Por exemplo, você deve separar os dados de produção dos dados que não são de produção ou distinguir entre metas de desempenho e métricas de negócios. A segmentação de dados ajuda na otimização de ambientes específicos, facilita a solução de problemas e limita imprecisões no monitoramento de desempenho. Ao manter uma distinção clara entre diferentes tipos de dados, você pode capturar, analisar e responder a métricas relevantes de forma mais eficiente e alinhar melhor a integridade da carga de trabalho com os objetivos da carga de trabalho. Para segmentar dados de desempenho, considere as seguintes recomendações:
Mantenha os dados de produção e os dados de não produção separados. Ao separar os dados por ambiente, você pode garantir o monitoramento focado e a otimização de cada ambiente. Em ambientes de produção, você pode identificar e resolver melhor os problemas de desempenho que afetam diretamente os usuários e as operações de negócios. Em ambientes que não são de produção, a separação de dados facilita a solução de problemas e o ajuste fino eficazes durante a fase de teste antes da implantação na produção.
Use um conjunto de dados em cada ambiente. Não use um conjunto de dados para metas de desempenho e outro conjunto de dados para alertas relacionados às metas de desempenho. A utilização de diferentes conjuntos de dados conduz a alertas imprecisos que comprometem a eficácia da monitorização do desempenho.
Separe as metas de desempenho e as métricas de negócios. As equipes de operações e desenvolvimento usam metas de desempenho para monitorar a integridade da carga de trabalho e atingir as metas de negócios. As métricas de negócios estão relacionadas a metas de negócios ou relatórios de clientes. Capture métricas de negócios em um fluxo de dados separado, mesmo que os dados se sobreponham diretamente. A separação oferece flexibilidade para capturar os dados certos e analisá-los de forma independente.
Definir políticas de retenção
As políticas de retenção ditam por quanto tempo os dados de desempenho devem ser mantidos. O estabelecimento dessas políticas ajuda a gerenciar o armazenamento de forma eficiente e garante que apenas os dados necessários estejam acessíveis para análise. Essas políticas oferecem suporte a um melhor desempenho e atendem aos padrões de conformidade. Você deve configurar políticas de retenção para os dados de log e métricas para permitir a solução de problemas e o monitoramento eficazes em todos os ambientes. Por exemplo, os logs e métricas podem precisar ser mantidos por mais tempo em um ambiente de produção do que no ambiente de teste. O período de retenção deve corresponder aos requisitos e regulamentos de conformidade da sua organização. Decida por quanto tempo reter os dados para fins de análise e auditoria. Arquive os dados de que não necessita para análise imediata.
Coletar dados de desempenho do aplicativo
A coleta de dados de aplicativos envolve o monitoramento e a análise das métricas de desempenho de um aplicativo, como taxa de transferência, latência e tempos de conclusão, coletados principalmente por meio de código de instrumentação. Os dados de desempenho do aplicativo fornecem informações valiosas sobre a integridade e o desempenho de um aplicativo. Ao monitorar e analisar dados de desempenho, você pode identificar e solucionar problemas, otimizar o desempenho do aplicativo e tomar decisões informadas para seu aplicativo.
Código do instrumento
Instrumentação refere-se ao processo de incorporar trechos de código ou integrar ferramentas em um código de aplicativo. O objetivo da instrumentação é capturar dados de desempenho enquanto o aplicativo é executado. É essencial reunir métricas que destaquem as operações críticas do aplicativo. Concentre-se em métricas como taxa de transferência, latência e tempo de conclusão. É importante diferenciar entre operações relacionadas ao negócio e operações que não são. Para dados pertencentes a operações de negócios, certifique-se de que seus metadados estejam estruturados de forma a permitir rastreamento e armazenamento distintos. O principal motivo para a instrumentação de código é coletar dados sobre como o aplicativo lida com sua carga de trabalho. Proporciona os seguintes benefícios:
Identificação de gargalos de desempenho: ao rastrear métricas como o uso da CPU e da memória, você pode identificar gargalos e otimizar o código de acordo.
Avaliando o comportamento do sistema sob uma carga: você pode ver como o aplicativo funciona em diferentes cargas de trabalho e cenários de estresse. Esses dados podem ajudá-lo a identificar problemas relacionados à escalabilidade, simultaneidade e uso de recursos.
Rastreando a integridade e a disponibilidade do aplicativo: como os indicadores-chave de desempenho são monitorados em tempo real, você pode receber alertas sobre possíveis problemas que afetam o desempenho e a disponibilidade do aplicativo.
Melhorar a experiência do usuário: você pode obter informações sobre como os usuários interagem com o aplicativo. Use essas informações para otimizar a experiência do usuário e identificar áreas para melhoria.
Planejar a capacidade e alocar recursos: os dados de desempenho que a instrumentação coleta podem fornecer informações valiosas sobre os requisitos de recursos de um aplicativo. Essas informações podem informar suas decisões sobre o planejamento da capacidade e a alocação de recursos.
Ao instrumentar o código para monitoramento de desempenho, considere as seguintes estratégias:
Use ferramentas APM: as ferramentas APM podem coletar e analisar dados de desempenho, incluindo métricas, rastreamentos e logs. As ferramentas APM oferecem recursos como instrumentação em nível de código, rastreamento de transações e perfil de desempenho.
Usar estruturas de registro em log e rastreamento: as estruturas de registro em log e rastreamento são ferramentas ou bibliotecas que os desenvolvedores integram em seus aplicativos para facilitar o registro em log e o rastreamento. Essas estruturas fornecem funções para gerar logs, rastrear solicitações e, às vezes, até mesmo formatar ou transportar os dados gerados. Ao incorporar estruturas de registro e rastreamento na base de código, os desenvolvedores podem capturar dados relevantes durante o tempo de execução. Os dados podem incluir informações sobre o caminho de execução, E/S e desempenho.
Instrumentação personalizada: os desenvolvedores podem adicionar código personalizado para coletar métricas de desempenho exclusivas para seu aplicativo e carga de trabalho. A instrumentação personalizada pode medir tempos de execução, controlar o uso de recursos ou capturar eventos específicos. Escreva instrumentação de código personalizada somente quando as métricas da plataforma forem insuficientes. Em algumas situações, o recurso da plataforma pode medir perspetivas agregadas ou até granulares do seu aplicativo. Pese a questão de duplicar esse esforço usando código personalizado contra compensações de código em excesso ou dependência de um recurso de plataforma.
Capture os tempos de transação. A captura de tempos de transação refere-se à medição dos tempos de ponta a ponta para funções técnicas essenciais como parte do monitoramento de desempenho. As métricas no nível do aplicativo devem incluir tempos de transação de ponta a ponta. Esses tempos de transação devem abranger funções técnicas essenciais, como consultas de banco de dados, tempos de resposta para chamadas de API externas e taxas de falha das etapas de processamento.
Use padrões de telemetria. Considere o uso de bibliotecas de instrumentação de ferramentas APM e ferramentas criadas em torno de um padrão de telemetria, como OpenTelemetry.
Habilitar rastreamento distribuído
O rastreamento distribuído é uma técnica usada para rastrear e monitorar solicitações à medida que elas fluem através de um sistema distribuído. Ele permite que você rastreie o caminho de uma solicitação à medida que ela percorre vários serviços e componentes, fornecendo informações valiosas sobre o desempenho e a eficiência de sua carga de trabalho. O rastreamento distribuído é importante para a eficiência do desempenho porque ajuda a identificar gargalos, problemas de latência e áreas para otimização dentro de um sistema distribuído. Você pode identificar onde ocorrem atrasos ou ineficiências e tomar as ações apropriadas para melhorar o desempenho visualizando o fluxo de uma solicitação. Siga estas etapas para habilitar o rastreamento distribuído:
Comece instrumentando seus aplicativos e serviços para gerar dados de rastreamento. Use bibliotecas ou estruturas que ofereçam suporte ao rastreamento distribuído, como OpenTelemetry.
Certifique-se de que as informações de rastreamento sejam propagadas através dos limites do serviço. Normalmente, você deve passar um ID de rastreamento exclusivo e outras informações contextuais com cada solicitação.
Configure um sistema centralizado de coleta de rastreamento. Este sistema recolhe e armazena os dados de rastreio gerados pelas suas aplicações e serviços.
Use os dados de rastreamento coletados para visualizar o fluxo de solicitações de ponta a ponta e analisar as características de desempenho do seu sistema distribuído.
Coletar logs de aplicativos
Quando você instrumenta o código, uma das saídas primárias deve ser logs de aplicativos. O registro em log ajuda você a entender como o aplicativo é executado em vários ambientes. Os logs do aplicativo registram as condições que produzem eventos do aplicativo. Colete logs de aplicativos em todos os ambientes de aplicativos. As entradas de log correspondentes no aplicativo devem capturar uma ID de correlação para suas respetivas transações. O ID de correlação deve correlacionar eventos de log do aplicativo em fluxos críticos do aplicativo, como o login do usuário. Use essa correlação para avaliar a integridade dos principais cenários no contexto de metas e requisitos não funcionais.
Você deve usar o registro estruturado. O registro estruturado acelera a análise e a análise de logs. Ele torna os logs mais fáceis de indexar, consultar e relatar sem complexidade. Adicione e use uma biblioteca de log estruturada no código do aplicativo. Às vezes, as entradas de log podem ajudá-lo a correlacionar dados que não foi possível correlacionar por outros meios.
Coletar dados de desempenho de recursos
Ao coletar dados de desempenho de recursos, você pode obter informações sobre a integridade e o comportamento de sua carga de trabalho. Os dados de desempenho de recursos fornecem informações sobre o uso de recursos, que é fundamental para o planejamento de capacidade. Esses dados também fornecem informações sobre a integridade de uma carga de trabalho e podem ajudá-lo a detetar problemas e solucionar problemas. Considere as seguintes recomendações:
Colete métricas e logs para cada recurso. Cada serviço do Azure tem um conjunto de métricas que é exclusivo para a funcionalidade do recurso. Essas métricas ajudam a entender a integridade e o desempenho do recurso. Adicione uma configuração de diagnóstico para cada recurso para enviar métricas para um local que sua equipe de carga de trabalho possa acessar à medida que cria alertas e painéis. Os dados métricos estão disponíveis para acesso de curto prazo. Para acesso de longo prazo ou para acesso a partir de um sistema que esteja fora do Azure Monitor, envie os dados métricos para o coletor unificado para o local de acesso.
Use ferramentas de plataforma. Inspire-se em soluções de monitorização incorporadas e integradas, como o Azure Monitor Insights. Essas ferramentas simplificam as operações de desempenho. Considere as ferramentas da plataforma ao selecionar uma plataforma e invista em ferramentas ou relatórios personalizados.
Monitore o tráfego de rede. Monitorar o tráfego de rede significa rastrear e analisar o fluxo e os padrões de dados à medida que eles se movem pelos caminhos da rede. Colete análises de tráfego e monitore o tráfego que atravessa os limites da sub-rede. Seu objetivo é analisar e otimizar o desempenho da rede.
Coletar dados de banco de dados e armazenamento
Muitos sistemas de banco de dados e armazenamento fornecem suas próprias ferramentas de monitoramento. Essas ferramentas coletam dados de desempenho específicos para esses sistemas. Os sistemas de banco de dados e armazenamento geralmente geram logs que contêm eventos e indicadores relacionados ao desempenho. Colete dados de banco de dados e dados de desempenho de armazenamento para que você possa identificar gargalos, diagnosticar problemas e tomar decisões informadas para melhorar o desempenho geral e a confiabilidade de sua carga de trabalho. Considere a coleta dos seguintes tipos de dados de desempenho:
Taxa de transferência: a taxa de transferência mede a quantidade de dados lidos ou gravados no sistema de armazenamento durante um período de tempo. Os dados de taxa de transferência indicam os recursos de transferência de dados.
Latência: a latência mede a duração das operações de armazenamento. Os dados de latência indicam a capacidade de resposta do sistema de armazenamento.
IOPS (operações de E/S por segundo): dados sobre o número de operações de leitura ou gravação que o sistema de armazenamento pode executar em um segundo. Os dados IOPS indicam a taxa de transferência e a capacidade de resposta do sistema de armazenamento.
Uso da capacidade: o uso da capacidade é a quantidade de capacidade de armazenamento usada e a quantidade disponível. Os dados de uso de capacidade ajudam as organizações a planejar necessidades futuras de armazenamento.
Para bancos de dados, você também deve coletar métricas específicas do banco de dados:
Desempenho da consulta: dados sobre o tempo de execução, o uso de recursos e a eficiência das consultas de banco de dados. Consultas de banco de dados lentas ou ineficientes podem diminuir significativamente uma carga de trabalho. Procure consultas lentas e que sejam executadas com frequência.
Desempenho da transação: dados sobre o desempenho de transações de banco de dados, como duração da transação, simultaneidade e contenção de bloqueio.
Desempenho do índice: dados sobre o desempenho de índices de banco de dados, como fragmentação de índice, estatísticas de uso e otimização de consultas.
Uso de recursos: dados que incluem CPU, memória, espaço em disco, E/S e largura de banda de rede.
Métricas de conexão: métricas que rastreiam o número de conexões ativas, anuladas e com falha. Altas taxas de falha podem indicar problemas de rede ou podem indicar que o banco de dados atingiu seu número máximo de conexões.
Taxas de transação: o número de transações que um banco de dados executa por segundo. Uma alteração nas taxas de transação pode indicar problemas de desempenho.
Taxas de erro: dados que indicam o desempenho de um banco de dados. Taxas de erro altas podem indicar um problema de desempenho. Colete e analise erros de banco de dados.
Coletar dados do sistema operacional
Uma solução de plataforma como serviço (PaaS) elimina a necessidade de coletar dados de desempenho do sistema operacional. No entanto, se sua carga de trabalho for executada em máquinas virtuais (infraestrutura como serviço), você precisará coletar dados de desempenho sobre o sistema operacional. Você precisa entender a demanda em seu sistema operacional e máquina virtual. Frequentemente exemplos de contadores de desempenho do sistema operacional. Por exemplo, você pode fazer uma amostra dos contadores de desempenho a cada minuto.
No mínimo, colete dados sobre as seguintes áreas de desempenho.
Área de atuação | Processo ou função |
---|---|
CPU | - Utilização da CPU (modo de utilizador ou modo privilegiado) - Comprimento da fila da CPU (número de processos que estão aguardando o tempo da CPU) |
Processo | - Contagem de threads de processo - Contagem de alças de processo |
Memória | - Memória comprometida - Memória disponível - Páginas por segundo - Uso de espaço de troca |
Disco | - Leitura de disco - Gravações em disco - Taxa de transferência do disco - Uso de espaço em disco |
Rede | - Taxa de transferência da interface de rede - Erros de interface de rede Rx/Tx |
Validar e analisar dados
Seus dados de desempenho devem estar alinhados com as metas de desempenho. Os dados precisam representar o desempenho da carga de trabalho ou do fluxo de forma completa e precisa no que diz respeito às metas de desempenho. Por exemplo, o tempo de resposta para um serviço Web tem uma meta de desempenho de 500 ms. Torne rotineira a análise dos dados, pois avaliações frequentes permitem a deteção precoce e a mitigação de problemas de desempenho.
Criar alertas. É benéfico ter alertas acionáveis, permitindo a rápida identificação e retificação de problemas de desempenho. Esses alertas devem indicar claramente o limite de desempenho violado, o potencial efeito comercial e os componentes envolvidos. Comece definindo o alerta comum e recomendado. Com o tempo, você pode modificar esses critérios com base em suas necessidades específicas. O principal objetivo desses alertas deve ser prever possíveis quedas de desempenho antes que elas se transformem em problemas significativos. Se não for possível definir um alerta para uma dependência externa, considere desenvolver um método para coletar medições indiretas, como a duração de uma chamada de dependência.
Defina limites de coleta de dados. Determine e defina limites lógicos para o volume de dados que você coleta e sua duração de retenção. Por vezes, a telemetria pode produzir quantidades avassaladoras de dados. É essencial concentrar-se em capturar apenas os indicadores de desempenho mais vitais ou ter um sistema eficiente para extrair insights significativos de seus dados de desempenho.
Facilitação do Azure
Centralização, segmentação e retenção de dados de desempenho: o Azure Monitor coleta e agrega dados de cada camada e componente de sua carga de trabalho em várias assinaturas e locatários do Azure e não do Azure. Ele armazena os dados em uma plataforma de dados comum para consumo por um conjunto comum de ferramentas que podem correlacionar, analisar, visualizar e/ou responder aos dados.
Você precisa de pelo menos um espaço de trabalho do Log Analytics para habilitar os Logs do Azure Monitor. Você pode usar um único espaço de trabalho para toda a sua coleta de dados. Você também pode criar vários espaços de trabalho com base nos requisitos para segmentar dados de desempenho. Ele também permite que você defina políticas de retenção.
Coletando dados de desempenho do aplicativo: o Application Insights é um recurso do Azure Monitor que ajuda você a monitorar o desempenho e a disponibilidade do seu aplicativo. Ele fornece informações no nível do aplicativo coletando dados de telemetria, como taxas de solicitação, tempos de resposta e detalhes de exceção. Você pode habilitar o Application Insights para seu aplicativo e configurá-lo para coletar os dados de desempenho necessários. O Application Insights também oferece suporte ao rastreamento distribuído. Configure o rastreamento distribuído para todos os fluxos. Para criar fluxos de transação de ponta a ponta, correlacione eventos provenientes de diferentes componentes ou camadas de aplicativos.
Os contadores de desempenho são uma maneira poderosa de monitorar o desempenho do seu aplicativo. O Azure fornece vários contadores de desempenho que você pode usar para coletar dados sobre o uso da CPU, uso da memória, E/S do disco, tráfego de rede e muito mais. Se você configurar seu aplicativo para emitir dados do contador de desempenho, o Azure Monitor coletará e armazenará os dados para análise.
Coleta de dados de desempenho de recursos: a maioria dos serviços do Azure gera logs e métricas de plataforma que fornecem informações de diagnóstico e auditoria. Ao habilitar as configurações de diagnóstico, você pode especificar os logs e métricas da plataforma para coletar e armazenar. Para fins de correlação, habilite o diagnóstico para todos os serviços suportados e, em seguida, envie os logs para o mesmo destino que os logs do aplicativo.
Coletando dados de desempenho de banco de dados e armazenamento: o Azure Monitor permite coletar dados de desempenho para bancos de dados no Azure. Você pode habilitar o monitoramento para o Banco de Dados SQL do Azure, o Banco de Dados do Azure para MySQL, o Banco de Dados do Azure para PostgreSQL e outros serviços de banco de dados. O Azure Monitor fornece métricas e logs para monitorar o desempenho do banco de dados, incluindo o uso da CPU, o uso da memória e o desempenho da consulta. Para ser notificado de problemas, você pode configurar alertas com base nos limites de desempenho.
O Azure oferece recomendações de desempenho para bancos de dados, como o SQL Server em Máquinas Virtuais do Azure. Essas recomendações ajudam a otimizar o desempenho das cargas de trabalho do banco de dados. Eles incluem sugestões para coletar contadores de desempenho, capturar estatísticas de espera e coletar dados de desempenho durante o horário de pico.
A Análise de Armazenamento do Azure permite coletar dados de desempenho para serviços de Armazenamento do Azure, como Armazenamento de Blob, Armazenamento de Tabela e Armazenamento de Filas. Você pode habilitar o registro em log e as métricas de suas contas de armazenamento para monitorar os principais indicadores de desempenho, como o número de operações de leitura/gravação, taxa de transferência e latência.
Coletando dados de desempenho do sistema operacional: a extensão de Diagnóstico do Azure permite coletar dados de desempenho detalhados de suas máquinas virtuais (VMs), incluindo CPU, memória, E/S de disco e tráfego de rede. Esses dados podem ser enviados para o Azure Monitor ou outros serviços de armazenamento para análise e alerta.
Validando e analisando dados de desempenho: no Azure Monitor, você pode usar os Logs do Azure Monitor para coletar, analisar e visualizar dados de log de seus aplicativos e sistemas. Você pode configurar os Logs do Monitor do Azure para ingerir logs do seu aplicativo, incluindo logs no nível do aplicativo e logs de infraestrutura. Ao agregar logs, você pode consultar eventos cruzados e obter informações sobre o desempenho do seu aplicativo. Para obter mais informações, consulte Azure Monitor Logs cálculos de custo e opções e Preços para o Azure Monitor.
No Azure Monitor, você pode definir regras de alerta para monitorar métricas de desempenho específicas e disparar alertas com base em condições predefinidas. Por exemplo, você pode criar uma regra de alerta para notificá-lo quando o uso da CPU exceder um determinado limite ou quando o tempo de resposta ultrapassar um limite especificado. Configure a regra de alerta para enviar notificações aos destinatários desejados.
Ao criar uma regra de alerta, você pode definir os critérios que determinam quando um alerta deve ser acionado. Você pode definir limites, métodos de agregação, janelas de tempo e a frequência da avaliação. Defina os critérios com base em seus requisitos de monitoramento de desempenho. Além de enviar notificações, você pode especificar ações a serem tomadas quando um alerta é acionado. As ações podem incluir enviar e-mails, chamar webhooks ou executar funções do Azure. Escolha as ações apropriadas para responder ao cenário de alerta específico.
Exemplos
- Aplicativo Web de serviços de aplicativo com redundância de zona altamente disponível de linha de base
- Monitorar um aplicativo de microsserviços no Serviço Kubernetes do Azure (AKS)
- Monitorização empresarial com o Azure Monitor
Ligações relacionadas
Lista de verificação de eficiência de desempenho
Consulte o conjunto completo de recomendações.