Práticas recomendadas de excelência operacional no Azure Monitor

Artigo
10/15/2024

A excelência operacional refere-se aos processos operacionais necessários para manter um serviço funcionando de forma confiável na produção. Use as informações a seguir para minimizar os requisitos operacionais para o monitoramento de suas máquinas virtuais.

Este artigo descreve a excelência operacional do Azure Monitor como parte do Azure Well-Architected Framework. O Well-Architected Framework do Azure é um conjunto de filosofias de orientação que podem ser usadas para melhorar a qualidade de uma carga de trabalho. A estrutura consiste em cinco pilares de excelência arquitetônica:

Fiabilidade
Segurança
Otimização de Custos
Excelência Operacional
Eficiência de Desempenho

Registos do Azure Monitor

Lista de verificação de estruturação

Projete uma arquitetura de espaço de trabalho com o número mínimo de espaços de trabalho para atender às suas necessidades de negócios.
Use a infraestrutura como código (IaC) ao gerenciar vários espaços de trabalho.
Use as informações do espaço de trabalho do Log Analytics para acompanhar a integridade e o desempenho dos espaços de trabalho do Log Analytics.
Crie regras de alerta para ser notificado proativamente sobre problemas operacionais no espaço de trabalho.
Certifique-se de ter um processo operacional bem definido para segregação de dados.

Recomendações de configuração

Recomendação	Benefício
Projete uma estratégia de espaço de trabalho para atender às suas necessidades de negócios.	Consulte Criar uma arquitetura de espaço de trabalho do Log Analytics para obter orientação sobre como projetar uma estratégia para seus espaços de trabalho do Log Analytics, incluindo quantos criar e onde colocá-los. Um único ou pelo menos um número mínimo de espaços de trabalho maximizará sua eficiência operacional, uma vez que limita a distribuição de seus dados operacionais e de segurança, aumentando sua visibilidade de possíveis problemas, tornando os padrões mais fáceis de identificar e minimizando seus requisitos de manutenção. Você pode ter requisitos para vários espaços de trabalho, como vários locatários, ou pode precisar de espaços de trabalho em várias regiões para dar suporte aos seus requisitos de disponibilidade. Nesses casos, certifique-se de ter os processos apropriados para gerenciar essa complexidade aumentada.
Use a infraestrutura como código (IaC) ao gerenciar vários espaços de trabalho.	Use Infraestrutura como Código (IaC) para definir os detalhes de seus espaços de trabalho em ARM, BICEP ou Terraform. Isso permite que você aproveite seus processos de DevOps existentes para implantar novos espaços de trabalho e a Política do Azure para impor sua configuração.
Use as informações do espaço de trabalho do Log Analytics para acompanhar a integridade e o desempenho dos espaços de trabalho do Log Analytics.	As informações do espaço de trabalho do Log Analytics fornecem uma visão unificada do uso, desempenho, integridade, agentes, consultas e log de alterações de todos os seus espaços de trabalho. Revise essas informações regularmente para acompanhar a integridade e a operação de cada um dos seus espaços de trabalho.
Crie regras de alerta para ser notificado proativamente sobre problemas operacionais no espaço de trabalho.	Cada espaço de trabalho tem uma tabela de operações que registra atividades importantes que afetam o espaço de trabalho. Crie regras de alerta com base nesta tabela para ser notificado proativamente quando ocorrer um problema operacional. Você pode usar alertas recomendados para o espaço de trabalho para simplificar a criação das regras de alerta mais críticas.
Certifique-se de ter um processo operacional bem definido para segregação de dados.	Você pode ter requisitos diferentes para diferentes tipos de dados armazenados em seu espaço de trabalho. Certifique-se de entender claramente os requisitos de retenção e segurança de dados ao projetar sua estratégia de espaço de trabalho e definir configurações, como permissões e retenção de longo prazo. Você também deve ter um processo claramente definido para ocasionalmente limpar dados com informações pessoais coletadas acidentalmente.

Alertas

Lista de verificação de estruturação

Use limites dinâmicos em regras de alerta métrico quando apropriado.
Sempre que possível, use uma regra de alerta para monitorar vários recursos.
Para controlar o comportamento em escala, use regras de processamento de alertas.
Aproveite as propriedades personalizadas para aprimorar o diagnóstico
Aproveite os aplicativos lógicos para personalizar, enriquecer e integrar com uma variedade de sistemas

Recomendações de configuração

Recomendação	Benefício
Use limites dinâmicos em regras de alerta métrico quando apropriado.	Você pode não ter certeza dos números corretos a serem usados como limites para suas regras de alerta. Os limites dinâmicos usam aprendizado de máquina e usam um conjunto de algoritmos e métodos para determinar os limites corretos com base nas tendências, para que você não precise saber o limite predefinido correto com antecedência. Os limites dinâmicos também são úteis para regras que monitoram vários recursos, e um único limite não pode ser configurado para todos os recursos. Consulte Limiares dinâmicos em alertas métricos.
Sempre que possível, use uma regra de alerta para monitorar vários recursos.	O uso de regras de alerta que monitoram vários recursos reduz a sobrecarga de gerenciamento, permitindo que você gerencie uma regra para monitorar um grande número de recursos.
Para controlar o comportamento em escala, use regras de processamento de alertas.	As regras de processamento de alertas podem ser usadas para reduzir o número de regras de alerta que você precisa criar e gerenciar.
Use propriedades personalizadas para aprimorar o diagnóstico.	Se a regra de alerta usar grupos de ações, você poderá adicionar suas próprias propriedades para incluir na carga útil da notificação de alerta. Você pode usar essas propriedades nas ações chamadas pelo grupo de ações, como webhook, função do Azure ou ações do aplicativo lógico.
Use aplicativos lógicos para personalizar o fluxo de trabalho de notificação e integrar com vários sistemas.	Você pode usar os Aplicativos Lógicos do Azure para criar e personalizar fluxos de trabalho para integração. Use Aplicativos lógicos para personalizar suas notificações de alerta. Pode: - Personalize o e-mail de alertas usando seu próprio assunto de e-mail e formato de corpo. - Personalize os metadados de alerta procurando tags para recursos afetados ou buscando um resultado de pesquisa de consulta de log. - Integração com serviços externos usando conectores existentes como Outlook, Microsoft Teams, Slack e PagerDuty. Você também pode configurar o aplicativo lógico para seus próprios serviços.

Máquinas virtuais

Lista de verificação de estruturação

Migre de agentes herdados para o agente do Azure Monitor.
Use o Azure Arc para monitorar suas VMs fora do Azure.
Use a Política do Azure para implantar agentes e atribuir regras de coleta de dados.
Estabelecer uma estratégia para a estrutura das regras de recolha de dados.
Considere migrar os pacotes de gerenciamento de cliente do System Center Operations Manager (SCOM) para o Azure Monitor.

Recomendações de configuração

Recomendação	Description
Migre de agentes herdados para o agente do Azure Monitor.	O agente do Azure Monitor é mais simples de gerenciar do que o agente herdado do Log Analytics e permite mais flexibilidade no design do espaço de trabalho do Log Analytics. Os agentes Windows e Linux permitem multihoming, o que significa que eles podem se conectar a vários espaços de trabalho. As regras de coleta de dados permitem que você gerencie suas configurações de coleta de dados em escala e defina configurações exclusivas com escopo para subconjuntos de máquinas. Consulte Migrar para o Azure Monitor Agent do agente do Log Analytics para obter considerações e métodos de migração.
Use o Azure Arc para monitorar suas VMs fora do Azure.	O Azure Arc for servers permite que você gerencie servidores físicos e máquinas virtuais hospedadas fora do Azure, em sua rede corporativa ou em outro provedor de nuvem. Com o agente de máquina conectada do Azure instalado, você pode implantar o agente do Azure Monitor nessas VMs usando o mesmo método que faz para suas VMs do Azure e, em seguida, monitorar toda a sua coleção de VMs usando as mesmas ferramentas do Azure Monitor.
Use a Política do Azure para implantar agentes e atribuir regras de coleta de dados.	A Política do Azure permite que os agentes sejam implantados automaticamente em conjuntos de VMs existentes e em quaisquer novas VMs criadas. Isso garante que todas as VMs sejam monitoradas com intervenção mínima dos administradores. Se você usar insights de VM, consulte Habilitar insights de VM usando a Política do Azure. Se você quiser gerenciar o agente do Azure Monitor sem insights de VM, consulte Habilitar o Agente do Azure Monitor usando a Política do Azure. Consulte [Gerenciar associações de regras de coleta de dados no Azure Monitor](.. /essentials/data-collection-rule-associations.md#create-new-association para um modelo criar uma associação de regra de coleta de dados.
Estabelecer uma estratégia para a estrutura das regras de recolha de dados.	As regras de coleta de dados definem dados a serem coletados de máquinas virtuais com o agente do Azure Monitor e para onde enviar esses dados. Cada DCR pode incluir vários cenários de coleta e ser associado a qualquer número de VMs. Estabeleça uma estratégia para configurar DCRs para coletar apenas os dados necessários para diferentes grupos de VMs, minimizando o número de DCRs que você precisa gerenciar.
Considere migrar pacotes de gerenciamento de cliente SCOM para o Azure Monitor.	Se você tiver um ambiente SCOM existente para monitorar cargas de trabalho de cliente, poderá migrar o suficiente da lógica do pacote de gerenciamento para o Azure Monitor para permitir que você aposente seu ambiente SCOM ou, pelo menos, aposente determinados pacotes de gerenciamento. Consulte Migrar do System Center Operations Manager (SCOM) para o Azure Monitor.

Contentores

Lista de verificação de estruturação

Revise as diretrizes para monitorar todas as camadas do seu ambiente Kubernetes.
Use o Kubernetes habilitado para Azure Arc para monitorar seus clusters fora do Azure.
Use os serviços gerenciados do Azure para ferramentas nativas da nuvem.
Integre clusters AKS em suas ferramentas de monitoramento existentes.
Use a política do Azure para habilitar a coleta de dados do cluster do Kubernetes.

Recomendações de configuração

Recomendação	Benefício
Revise as diretrizes para monitorar todas as camadas do seu ambiente Kubernetes.	Monitore o desempenho do cluster Kubernetes com O Container insights inclui orientação e práticas recomendadas para monitorar todo o ambiente Kubernetes a partir das camadas de rede, cluster e aplicativo.
Use o Kubernetes habilitado para Azure Arc para monitorar seus clusters fora do Azure.	O Kubernetes habilitado para Azure Arc permite que seus clusters Kubernetes em execução em outras nuvens sejam monitorados usando as mesmas ferramentas que seus clusters AKS, incluindo insights de contêiner e serviço gerenciado do Azure Monitor para Prometheus.
Use os serviços gerenciados do Azure para ferramentas nativas da nuvem.	O serviço gerenciado do Azure Monitor para Prometheus e o Azure managed Grafana dão suporte a todos os recursos das ferramentas nativas da nuvem Prometheus e Grafana sem precisar operar sua infraestrutura subjacente. Você pode provisionar rapidamente essas ferramentas e integrar seus clusters Kubernetes com sobrecarga mínima. Esses serviços permitem que você acesse uma extensa biblioteca de regras e painéis da comunidade para monitorar seu ambiente Kubernetes.
Integre clusters AKS em suas ferramentas de monitoramento existentes.	Se você tiver um investimento existente no Prometheus e no Grafana, integre seus clusters AKS e serviços gerenciados do Azure em seu ambiente existente usando as orientações em Monitorar clusters Kubernetes usando serviços do Azure e ferramentas nativas da nuvem.
Use a política do Azure para habilitar a coleta de dados do cluster do Kubernetes.	Use a Política do Azure para habilitar a coleta de dados para habilitar métricas do Prometheus, insights de contêiner e configurações de diagnóstico. Isso garante que todos os novos clusters sejam monitorados automaticamente e impõe sua configuração de monitoramento.

Próximo passo

Obtenha as práticas recomendadas para uma implantação completa do Azure Monitor.

Partilhar via

Práticas recomendadas de excelência operacional no Azure Monitor

Registos do Azure Monitor

Lista de verificação de estruturação

Recomendações de configuração

Alertas

Lista de verificação de estruturação

Recomendações de configuração

Máquinas virtuais

Lista de verificação de estruturação

Recomendações de configuração

Contentores

Lista de verificação de estruturação

Recomendações de configuração

Próximo passo

Comentários

Recursos adicionais