Compartilhar via


Considerações de monitoramento para cargas de trabalho de Solução VMware no Azure

Este artigo discute a área de design de monitoramento de uma carga de trabalho Solução VMware no Azure. Essa área se concentra nas práticas recomendadas de observabilidade. As diretrizes destinam-se a uma equipe de operações. Microsoft, VMware e terceiros fornecem várias ferramentas que você pode usar para monitorar sua infraestrutura e aplicativo. Este artigo lista essas opções.

Cada opção oferece soluções de monitoramento com diferentes graus de custos de licenciamento, opções de integração, escopo de monitoramento e suporte. Examine cuidadosamente os termos e condições aplicáveis antes de usar as ferramentas.

Coletar dados de infraestrutura

Impacto: Excelência operacional

O monitoramento da carga de trabalho envolve a coleta de dados de Solução VMware no Azure infraestrutura e vários componentes da solução VMware. Solução VMware no Azure é integrado ao datacenter definido pelo software VMware (SDDC), que executa vários componentes nativos da solução VMware, como o VMware Aria. Você pode usar esse conjunto de ferramentas, incluindo o VMware Aria Operations, para gerenciar vários aspectos de sua infraestrutura.  

Outra ferramenta à sua disposição é o Status de Integridade do VMware vSphere para Solução VMware no Azure. Essa ferramenta ajuda a garantir que a detecção e a correção proativas de problemas sejam executadas continuamente em seu ambiente de Solução VMware no Azure. Em particular, essa ferramenta encontra configurações incorretas na infraestrutura VMware vSphere e detecta gargalos de desempenho. Ele também fornece insights sobre a utilização de recursos e o desempenho geral da saúde ambiental.

O VMware Aria Operations for Networks ajuda você a obter visibilidade de rede abrangente, simplificar processos de solução de problemas e otimizar o desempenho da rede.

Recomendações
  • Configure o Status de Integridade do VMware vSphere para obter uma exibição de alto nível do Solução VMware no Azure status de integridade de nuvem privada.
  • Use ferramentas de terceiros, como o VMware Aria Suite, para maior visibilidade e análise de Solução VMware no Azure infraestrutura de rede de nuvem privada.
  • Use ferramentas de monitoramento nativas do Azure, como:
    • Azure Monitor.
    • Operações do VMware Aria para monitoramento operacional.
    • Azure Policy e seus dashboard associados para monitoramento de conformidade.
    • Microsoft Defender para Nuvem e Microsoft Sentinel para monitoramento de segurança.

Gerenciar logs e arquivos

Impacto: Excelência operacional

Para obter dados de integridade dos componentes da solução VMware, você precisa de acesso aos logs coletados pelo serviço Syslog do VMware. Exemplos de componentes de solução incluem VMware ESXi, VMware vSAN, Data Center do VMware NSX-T e VMware vCenter Server. Os logs desses componentes estão disponíveis por meio Solução VMware no Azure infraestrutura. Um agente ou extensão do Log Analytics envia logs de convidado no nível da VM (máquina virtual) para o Log Analytics. Em Solução VMware no Azure, você pode enviar os logs de Solução VMware no Azure para um blob de armazenamento nativo do Azure. Para enviar logs para um blob de armazenamento, você pode configurar encaminhadores de um servidor de syslog centralizado ou configurar o blob como um destino no Azure Monitor. Também é possível usar uma ferramenta nativa do Azure, como aplicativos lógicos do Azure ou Azure Functions para encaminhar logs. Você pode usar essas ferramentas para criar ouvintes para logs de entrada de Solução VMware no Azure e enviar os logs para um blob de armazenamento.

Os logs de arquivamento são uma estratégia para manter os custos de armazenamento baixos. Os blobs do Armazenamento do Azure e o Log Analytics podem transferir logs para arquivamento de longo prazo. Usar um blob de armazenamento é a opção mais barata. Mas o Log Analytics tem integrações avançadas para alertas, visualização, consulta e obtenção de insights baseados em machine learning. Considere seu orçamento, casos de uso funcional e casos de uso de longo prazo ao escolher uma solução.

Recomendações
  • Colete logs do serviço de syslog do VMware para obter dados de integridade de componentes da solução VMware, como VMware ESXi, VMware vSAN, VMware NSX-T Data Center e VMware vCenter Server.
  • Configure ferramentas como operações do VMware Aria para registro em log para coletar vários logs para consultar, analisar e relatar recursos.
  • Configure as durações de retenção para enviar logs para o armazenamento de longo prazo para reduzir o tempo de consulta e economizar nos custos de armazenamento.

Monitorar o sistema operacional convidado

Impacto: Excelência operacional

No sistema operacional convidado, as métricas estão disponíveis para uso de disco, desempenho do aplicativo, utilização de recursos do sistema e atividade do usuário. Considere usar o Azure Arc para Solução VMware no Azure (versão prévia) para gerenciar recursos de infraestrutura do VMware no Azure. Para obter mais informações, consulte Implantar o Azure Arc para Solução VMware no Azure.

Recomendações
  • Habilite o gerenciamento de convidados e instale as extensões do Azure depois que sua nuvem privada for habilitada pelo Azure Arc para servidores ou pelo Azure Arc para Solução VMware no Azure (versão prévia).
  • Instale agentes extras para coletar dados para habilitar o gerenciamento e o monitoramento de convidados em Solução VMware no Azure VMs convidadas.  

Implementar o monitoramento de segurança

Impacto: Segurança, excelência operacional

O monitoramento de segurança é fundamental para detectar e responder a atividades anômalas. As cargas de trabalho executadas em uma nuvem privada Solução VMware no Azure precisam de monitoramento de segurança abrangente que abrange redes, recursos do Azure e a própria nuvem privada Solução VMware no Azure. Você pode centralizar eventos de segurança implantando um workspace do Microsoft Sentinel. Usando essa integração, a equipe de operação pode exibir, analisar e detectar incidentes de segurança no contexto de um cenário de ameaças organizacionais mais amplo.

Recomendações
  • Habilite o Defender para Nuvem na assinatura do Azure que você usa para implantar o Solução VMware no Azure nuvem privada. Verifique se, no plano do Defender para Nuvem, a configuração do CWP (Cloud Workload Protection) tem um valor ON para servidores.
  • Ações de auditoria que os usuários privilegiados assumem na nuvem privada Solução VMware no Azure. Para obter mais informações, consulte Histórico de atividades de auditoria para atribuições de grupo no gerenciamento de identidade com privilégios.
  • Integre o Microsoft Sentinel ao Defender para Nuvem. Habilite seu coletor de dados para eventos de segurança e conecte-o ao Defender para Nuvem.
  • Use soluções de monitoramento de segurança de parceiros validados no Solução VMware no Azure.

Monitorar e analisar redes

Impacto: Segurança, excelência operacional

O processo de monitoramento de rede inspeciona todo o tráfego que entra e sai do Solução VMware no Azure nuvem privada. Em Solução VMware no Azure, a segurança de rede opera nas camadas de rede e host.

Recomendações
  • Capture e monitore os logs de firewall de rede implantados na nuvem privada Solução VMware no Azure. Monitore também os logs implantados no Azure quando seu aplicativo se estende para dispositivos nativos do Azure, como Firewall do Azure ou Gateway de Aplicativo do Azure. Para obter mais informações, confira Integração de firewall na Solução VMware no Azure.
  • Use Firewall do Azure Pasta de Trabalho ou ferramentas semelhantes para monitorar métricas e logs comuns relacionados a dispositivos de firewall.
  • Correlacionar logs de vários vetores de segurança, como vetores de identidade, rede e infraestrutura.

Configurar e simplificar alertas

Impacto: excelência operacional, otimização de custo

Ao executar cargas de trabalho no Solução VMware no Azure nuvem privada, você precisa monitorar efetivamente o desempenho da carga de trabalho. Por exemplo, você deve capturar logs, métricas e solicitações de rastreamento para suas camadas de aplicativo e infraestrutura.

Os alertas podem ajudá-lo a responder às alterações em sua linha de base de desempenho. Você também pode usar alertas para fornecer informações sobre as alterações necessárias de manutenção ou configuração. Por exemplo, você pode receber notificações quando uma chave expira, uma conexão é perdida ou há o risco de exceder a capacidade de um recurso.

Para tornar os alertas eficazes, configure-os para notificar as equipes responsáveis quando determinadas condições forem atendidas. Considere também a consolidação de alertas para reduzir o número de notificações individuais enviadas:

  • Em vez de emitir um alerta para cada computador com pouco espaço, considere consolidar alertas por hosts, grupos de recursos ou clusters.
  • Use essa abordagem também com problemas de host, CPU e picos de armazenamento.
  • Alertas básicos em janelas de tempo. Por exemplo, se um host emitir alertas por um curto período de tempo, você poderá suprimir os alertas de acordo com um limite de tempo definido. Por exemplo, você pode enviar um alerta somente após cinco minutos.
Recomendações
  • Discutir e estabelecer linhas de base baseadas em dados de desempenho.
  • Defina critérios de alerta relevantes, como limites, níveis de severidade ou condições específicas.
  • Use o subsistema de eventos e alarmes VMware vSphere para monitorar o VMware vSphere e configurar gatilhos.
  • Configure alertas do Azure em Solução VMware no Azure para responder a eventos em tempo real.
  • Verifique se os alertas estão configurados para que o espaço de slack do repositório de dados VMware vSAN seja mantido nos níveis exigidos pelo SLA (contrato de nível de serviço).
  • Configure alertas de integridade do recurso para obter a status de integridade em tempo real da nuvem privada Solução VMware no Azure.
  • Use as ferramentas de APM (monitoramento de desempenho de aplicativos) para obter insights de desempenho no nível do código do aplicativo.
  • Use uma combinação de técnicas de monitoramento, como transações sintéticas, monitoramento de pulsação e monitoramento de ponto de extremidade.
  • Priorize alertas com base em seu impacto nas operações ou na criticalidade dos sistemas afetados. Ajuste alertas para disparar apenas eventos significativos.
  • Para reduzir o ruído e gerenciar alertas com eficiência, use métodos para reduzir o número de notificações individuais emitidas.
  • Para minimizar a fadiga do alerta, empregue um mecanismo para notificar os principais stakeholders apenas sobre eventos significativos.
  • Use canais de notificação, como SMS, email, notificações por push e plataformas de colaboração, como o Microsoft Teams, para garantir que os alertas sejam entregues com eficiência.

Gerenciar os custos

Impacto: otimização de custos, excelência operacional

O monitoramento de custos refere-se à capacidade de acompanhar os custos associados ao Solução VMware no Azure nuvem privada.

Recomendações
  • Use o subsistema de eventos e alarmes do VMware vSphere para monitorar o VMware vSphere e configurar gatilhos.
  • Configure alertas do Azure baseados em consultas do Log Analytics para Solução VMware no Azure. Esses alertas ajudam sua equipe de operação a responder a eventos esperados e inesperados em tempo real.

Usar ferramentas de solução de problemas e depuração

Impacto: otimização de custos, excelência operacional

Para depurar e solucionar problemas de seu aplicativo com eficiência, você precisa de logs, métricas e informações associadas. Essas informações incluem atividades de evento para que você possa identificar, analisar e estabelecer conexões entre eventos.

Recomendações
  • Configure seu sistema para encaminhar logs do serviço Solução VMware no Azure syslog para o Log Analytics. Encaminhe todos os logs, métricas e informações de diagnóstico relevantes.
  • Configure um agente de servidor habilitado pelo Azure Arc em VMs convidadas que são executadas dentro do Solução VMware no Azure nuvem privada.

Usar painéis

Impacto: excelência operacional

Os painéis de aplicativos ajudam você a visualizar e monitorar o desempenho, a integridade e outras métricas de um aplicativo:

  • O monitoramento de relatórios em painéis ajuda você a fazer a análise de causa raiz e a solução de problemas rapidamente. As equipes de operações podem usar esses painéis para exibir todos os principais recursos que compõem Solução VMware no Azure em um único painel.
  • As métricas do painel fornecem informações sobre como as alterações de código e infraestrutura afetam o comportamento do aplicativo.
  • Os visuais ajudam as equipes de suporte ao cliente a entender o impacto das alterações, do desempenho e dos problemas de disponibilidade em um aplicativo.
  • Os indicadores de desempenho beneficiam a liderança executiva e os stakeholders de negócios. Essas ferramentas informam decisões que alinham o desempenho de um aplicativo com os objetivos de negócios. Por exemplo, um executivo pode monitorar o compromisso com os clientes examinando métricas como disponibilidade do serviço, tempos de resolução de incidentes e tempos médios de resposta. Essas métricas ajudam a garantir que a organização forneça serviços de acordo com seu SLA.

Além de oferecer insights, os painéis também podem promover a transparência e incentivar a colaboração, por exemplo, quando você concede aos stakeholders apropriados acesso aos painéis do aplicativo. Esse ato cultiva uma compreensão compartilhada do desempenho de um aplicativo. Essa prática também permite que uma organização tome decisões informadas. Como resultado, os stakeholders podem se concentrar em buscar iniciativas cruciais que impulsionem os negócios para a frente.

Recomendações
  • Crie um aplicativo dashboard com o Application Insights ou o Grafana. Conecte o dashboard a fontes de dados relevantes que armazenam métricas de seu ambiente de Solução VMware no Azure.
  • Crie uma pasta de trabalho do Azure como um repositório central para consultas, métricas e relatórios interativos normalmente executados.
  • Verifique se a fonte de dados está alinhada com os requisitos de segurança e conformidade.
  • Defina controles de acesso e permissões, como autenticação de usuário e controle de acesso baseado em função. Verifique se cada stakeholder tem acesso apropriado com base em sua função.
  • Realize revisões periódicas de acesso para marcar que o acesso do usuário esteja atualizado e alinhado com as funções e responsabilidades atuais.

Próximas etapas

Agora que você analisou as melhores práticas de observabilidade em Solução VMware no Azure, explore mecanismos, ferramentas e perímetros que você pode usar para proteger ainda mais as cargas de trabalho no SDDC.

Use a ferramenta de avaliação para avaliar suas opções de design.