Compartilhar via


Monitorar um único cluster do Azure Stack HCI com o Insights

Aplica-se a: Azure Local, versão 22H2

Importante

O Azure Stack HCI agora faz parte do Azure Local. A renomeação da documentação do produto está em andamento. No entanto, as versões mais antigas do Azure Stack HCI, por exemplo, 22H2, continuarão a fazer referência ao Azure Stack HCI e não refletirão a alteração de nome. Saiba mais.

Este artigo explica como usar o Insights para monitorar um único cluster do Azure Stack HCI. Para vários clusters do Azure Stack HCI, consulte Monitorar vários clusters do Azure Stack HCI com o Insights.

O Insights é um recurso do Azure Monitor que permite que você comece a monitorar rapidamente o cluster do Azure Stack HCI. Você pode exibir as principais métricas, integridade e informações de uso relacionadas a cluster, servidores, máquinas virtuais e armazenamento.

Importante

Se você registrou seu cluster do Azure Stack HCI e configurou o Insights antes de novembro de 2023, determinados recursos que usam o AMA (Agente do Azure Monitor), como Arc for Servers, VM Insights, Defender for Cloud ou Sentinel, podem não coletar logs e dados de eventos corretamente. Para obter diretrizes de solução de problemas, consulte a seção Solucionar problemas de clusters registrados antes de novembro de 2023 .

Benefícios

O Insights for Azure Stack HCI oferece os seguintes benefícios:

  • Gerenciado pelo Azure. O Insights é gerenciado pelo Azure e acessado por meio do portal do Azure, garantindo que esteja sempre atualizado. Não há necessidade de banco de dados ou configuração de software especial.

  • Escalabilidade. O Insights é capaz de carregar mais de 400 conjuntos de informações de cluster em várias assinaturas simultaneamente. Não há limitações de cluster, domínio ou localização física.

  • Capacidade de personalização. A experiência do Insight é criada com base nos modelos de pasta de trabalho do Azure Monitor. Isso permite que você altere as exibições e consultas, modifique ou defina limites que se alinhem aos seus limites específicos e, em seguida, salve essas personalizações em uma pasta de trabalho. Em seguida, você pode fixar gráficos nas pastas de trabalho nos painéis do Azure.

Configurar insights para o Azure Stack HCI

Os pré-requisitos e as configurações para usar o Insights variam dependendo da versão do Azure Stack HCI que você tem. Selecione uma das guias a seguir para obter instruções sobre como usar o Insights em sua versão específica do Azure Stack HCI.

O recurso Insights no Azure Stack HCI, versões 22H2 e posteriores, usa o AMA, que oferece vantagens significativas em comparação com o MMA (Microsoft Monitoring Agent) herdado usado no Azure Stack HCI, versão 21H2 e anterior. Essas vantagens incluem velocidade aprimorada, segurança aprimorada e desempenho superior. Você pode integrar novos nós ao AMA ou migrar seus nós existentes do agente herdado para o AMA.

Recomendamos que você atualize seu sistema Azure Stack HCI para a versão 22H2 ou posterior para aproveitar a experiência do Insights com o AMA.

A partir da atualização cumulativa de maio de 2023 para o Azure Stack HCI, versão 22H2, você pode monitorar sistemas locais do Azure Stack HCI com o Insights para Azure Stack HCI.

Pré-requisitos

Aqui estão os pré-requisitos para usar o Insights for Azure Stack HCI:

  • O cluster do Azure Stack HCI deve ser registrado com o Azure e habilitado para Arc. Se você registrou seu cluster em ou após 15 de junho de 2021, isso acontece por padrão. Caso contrário, você deve habilitar a integração do Azure Arc.

  • O cluster deve ter o Azure Stack HCI, versão 22H2 e a atualização cumulativa de maio de 2023 ou posterior instalada.

  • A identidade gerenciada para o recurso do Azure deve estar habilitada. Para obter mais informações, consulte Gerenciamento avançado habilitado.

Habilitar os Insights

Habilitar o Insights ajuda você a monitorar todos os clusters do Azure Stack HCI atualmente associados ao workspace do Log Analytics, fornecendo métricas de integridade úteis. O Insights instala o Agente do Azure Monitor e ajuda você a configurar DCRs (regras de coleta de dados) para monitorar o cluster do Azure Stack HCI.

Para habilitar essa funcionalidade no portal do Azure, siga estas etapas:

  1. No portal do Azure, navegue até a página de recursos de cluster do Azure Stack HCI e selecione o cluster. Na guia Recursos, selecione Insights.

    Captura de tela mostrando o bloco Insights.

  2. Na página Insights , selecione Introdução.

    Captura de tela mostrando o botão Começar.

    Observação

    O botão Introdução está disponível apenas para o Azure Stack HCI, versão 22H2 com a atualização cumulativa de maio de 2023 ou posterior instalada e somente depois que a identidade gerenciada estiver habilitada. Caso contrário, este botão será desativado.

  3. Na página de configuração do Insights, selecione um DCR existente no menu suspenso Regra de coleta de dados. O DCR especifica os logs de eventos e os contadores de desempenho que precisam ser coletados e os armazena em um workspace do Log Analytics. O Insights cria um DCR padrão se ainda não existir. Somente os DCRs habilitados para Insights são incluídos.

    Captura de tela mostrando a janela de configuração do Insights.

  4. (Opcional) Você também pode criar um novo DCR selecionando Criar novo na página de configuração do Insights.

    Importante

    É altamente recomendável que você não crie seu próprio DCR. O DCR criado pelo Insights inclui um fluxo de dados especial necessário para sua operação. Você pode editar esse DCR para coletar mais dados, como eventos do Windows e do Syslog. Os DCRs criados por meio da instalação do AMA terão um prefixo AzureStackHCI- anexado ao nome do DCR.

    1. Na página Nova regra de coleta de dados, especifique a assinatura, o nome do DCR e o nome do ponto de extremidade de coleta de dados (DCE). As DCEs são usadas para acessar o serviço de configuração para buscar DCRs associadas para o Agente do Azure Monitor. Para obter mais informações sobre a DCE, consulte Pontos de extremidade de coleta de dados no Azure Monitor.

      Observação

      Se você estiver usando links privados no agente, deverá adicionar DCEs. Para obter mais informações sobre as configurações de rede do AMA, consulte Definir configurações de rede do Agente do Azure Monitor.

      Captura de tela mostrando a janela da regra de coleta de dados.

    2. Selecione o botão Revisar + criar.

      Se um DCR ainda não tiver sido criado para o cluster não monitorado, um será criado com contadores de desempenho habilitados e o canal de log de eventos do Windows habilitado.

  5. Examine a tela final com um resumo do nome do DCR, número de logs de eventos, contadores de desempenho e nome do workspace do Log Analytics no qual os dados são armazenados. Selecione Configurar.

    Captura de tela mostrando o seletor suspenso da regra de coleta de dados.

    Depois de selecionar Configurar, você será redirecionado para a página Extensões , onde poderá ver o status da instalação do agente. Ao configurar o Insights, o AMA é instalado automaticamente em todos os nós do cluster.

  6. Vá para a página de recursos de cluster do Azure Stack HCI e selecione o cluster. O Insights agora é exibido como Configurado na guia Recursos :

    Captura de tela mostrando o bloco Insights como Configurado.

Regras de coleta de dados

Ao habilitar o Insights em um computador com o Agente do Azure Monitor, você deve especificar um DCR a ser usado. Para obter mais informações sobre DCRs, consulte Regras de coleta de dados no Azure Monitor.

Opção Descrição
Contadores de desempenho Especifica quais contadores de desempenho de dados devem ser coletados do sistema operacional. Esta opção é necessária para todos os computadores. Esses contadores de desempenho são usados para preencher as visualizações na pasta de trabalho do Insights. Atualmente, a pasta de trabalho do Insights usa cinco contadores de desempenho - Memory()\Available Bytes, Network Interface()\Bytes Total/sec, Processor(_Total)\% Processor Time, RDMA Activity()\RDMA Inbound Bytes/sece RDMA Activity()\RDMA Outbound Bytes/sec
Canal de log de eventos Especifica quais logs de eventos do Windows devem ser coletados do sistema operacional. Esta opção é necessária para todos os computadores. Os logs de eventos do Windows são usados para preencher as visualizações na pasta de trabalho do Insights. Atualmente, os dados são coletados por meio de dois canais de log de eventos do Windows: - microsoft-windows-health/operational e microsoft-windows-sddc-management/operational
Espaço de Trabalho do Log Analytics Espaço de trabalho para armazenar os dados. Somente workspaces com Insights são listados.

Canal de evento

O Microsoft-windows-sddc-management/operational canal de eventos e Microsoft-windows-health/operational do Windows é adicionado ao workspace do Log Analytics em logs de eventos do Windows.

Captura de tela mostrando a janela Adicionar fonte de dados.

Ao coletar esses logs, o Insights mostra o status de integridade dos servidores, unidades, volumes e VMs individuais. Por padrão, cinco contadores de desempenho são adicionados.

Contadores de desempenho

Por padrão, cinco contadores de desempenho são adicionados:

Captura de tela mostrando contadores de desempenho adicionada.

A tabela a seguir descreve os contadores de desempenho monitorados:

Contadores de desempenho Descrição
Memória(*)\Bytes Disponíveis Bytes disponíveis é a quantidade de memória física, em bytes, imediatamente disponível para alocação a um processo ou para uso do sistema.
Interface de rede(*)\Total de bytes/s A taxa na qual os bytes são enviados e recebidos em cada adaptador de rede, incluindo caracteres de enquadramento. Total de bytes/s é uma soma de bytes recebidos/s e bytes enviados/s.
Processor(_Total)% Processor Time A porcentagem de tempo decorrido que todos os threads de processo usaram o processador para executar instruções.
Atividade RDMA(*)\Bytes de entrada RDMA/s Taxa de dados recebidos por RDMA pelo adaptador de rede por segundo.
Atividade RDMA(*)\Bytes de saída RDMA/s Taxa de dados enviados por RDMA pelo adaptador de rede por segundo.

Depois de ativar o Insights, pode levar até 15 minutos para coletar os dados. Quando o processo for concluído, você poderá ver uma visualização avançada da integridade do cluster no menu Insights no painel esquerdo:

Captura de tela mostrando visualizações do Insight.

Desativar Insights

Para desativar o Insights, siga estas etapas:

  1. Selecione Insights na guia Recursos .

  2. Selecione Desativar Insights.

    Captura de tela mostrando a janela Desativar Insights.

Quando você desabilita o recurso Insights, a associação entre a regra de coleta de dados e o cluster é excluída e os logs do Serviço de Integridade e do Gerenciamento do SDDC não são mais coletados; no entanto, os dados existentes não são excluídos. Se você quiser excluir esses dados, acesse o workspace do DCR e do Log Analytics e exclua os dados manualmente.

Atualizar insights

O bloco Insights mostra uma mensagem Precisa de atualização nos seguintes casos:

  • Uma regra de coleta de dados é alterada.
  • Um evento de integridade do log de eventos do Windows é excluído.
  • Qualquer um dos cinco contadores de desempenho do workspace do Log Analytics é excluído.

Para ativar o Insights novamente, siga estas etapas:

  1. Selecione o bloco Insights em Recursos.

  2. Selecione Atualizar para ver as visualizações novamente.

    Captura de tela mostrando a janela Atualizar Insights.

Migrar do Microsoft Monitoring Agent

  1. Para migrar do Microsoft Monitoring Agent (MMA) para o Azure Monitoring Agent (AMA), role para baixo até Insights.

    Captura de tela mostrando a janela Instalar AMA.

  2. Selecione Instalar AMA; a janela de configuração do Insights é aberta.

    Captura de tela mostrando a janela Regras de coleta de dados.

  3. Selecione ou crie uma regra de coleta de dados conforme descrito anteriormente na seção Habilitar Insights .

O Agente do Azure Monitor e a extensão do Agente de Monitoramento da Microsoft podem ser instalados no mesmo computador durante a migração. A execução de ambos os agentes pode levar à duplicação de dados e ao aumento do custo. Se um computador tiver ambos os agentes instalados, você verá um aviso no portal do Azure informando que pode estar coletando dados duplicados, conforme mostrado na captura de tela a seguir.

Aviso

A coleta de dados duplicados de um único computador com o Agente do Azure Monitor e a extensão do Agente de Monitoramento da Microsoft pode resultar em custo extra de ingestão do envio de dados duplicados para o workspace do Log Analytics.

Captura de tela mostrando um aviso de duplicação de dados.

Você deve remover a extensão do Microsoft Monitoring Agent de todos os computadores que a estiverem usando. Antes de executar esta etapa, verifique se o computador não está dependendo de nenhuma outra solução que exija o Microsoft Monitoring Agent. Depois de verificar se MicrosoftMonitoringAgent ainda não está conectado ao workspace do Log Analytics, você pode remover MicrosoftMonitoringAgent manualmente redirecionando para a página Extensões .

Captura de tela mostrando a lista de extensões.

Solucionar problemas

Esta seção fornece diretrizes para resolver os problemas com o uso do Insights para Azure Stack HCI.

Resolver problemas de clusters registrados antes de novembro de 2023

Questão. Em clusters registrados antes de novembro de 2023, os recursos que usam o AMA no Azure Stack HCI, como Arc for Servers, VM Insights, Container Insights, Defender for Cloud e Sentinel, podem não coletar logs e dados de eventos corretamente.

Causa. Antes de novembro de 2023, o registro do cluster configurava o AMA para usar a identidade do cluster, enquanto os serviços que usam o AMA no Azure Stack HCI exigiam a identidade do nó do cluster para a coleta de logs adequada. Essa incompatibilidade resultou na coleta inadequada de logs desses serviços.

Solução. Para resolver esse problema, fizemos uma alteração no registro do cluster HCI para que o AMA use a identidade do servidor. Para implementar essa alteração, execute as seguintes etapas em clusters registrados antes de novembro de 2023:

  1. Reparar o registro do cluster. Consulte Reparar registro de cluster.
  2. Reparar AMA. Consulte Reparar AMA.
  3. Reconfigure o Insights para o Azure Stack HCI. Consulte Reconfigurar insights para o Azure Stack HCI.

No portal do Azure, a página Insights for Azure Stack HCI detecta automaticamente a alteração na configuração do AMA e exibe uma faixa na parte superior da página, orientando você a tomar as ações necessárias para continuar usando os serviços que dependem do AMA.

Captura de tela mostrando o banner para reconfigurar o Insights.

Reparar o registro do cluster

Siga estas etapas para reparar o registro do cluster:

  1. Nos nós de cluster, instale o módulo mais recente Az.StackHCI do PowerShell. Substitua latestversion pelo número da versão mais recente Az.StackHCI .

    Install-Module -Name Az.StackHCI -RequiredVersion {latestversion} -Scope CurrentUser -Repository PSGallery -Force 
    
  2. Execute o comando repair registration para remover regkey:

    Register-AzStackHCI -TenantId {TenantID} -SubscriptionId {subscriptionID} -ComputerName {NodeName} -RepairRegistration 
    
Reparar o AMA para o Azure Stack HCI

Escolha uma das seguintes opções para reparar o AMA:

  • Opção 1: desinstalar o AMA

    Se o AMA já estiver atualizado, desinstale-o. Siga estas etapas para desinstalar o AMA:

    1. No portal do Azure, acesse a página Extensões do cluster do Azure Stack HCI.

    2. Marque a caixa de seleção AzureMonitorWindowsAgent e selecione Desinstalar.

      Captura de tela mostrando AzureMonitorWindowsAgent para desinstalar o AMA.

  • Opção 2: Atualizar AMA

    Siga estas etapas para atualizar o AMA:

    1. No portal do Azure, acesse a página Extensões do cluster do Azure Stack HCI.

    2. Marque a caixa de seleção AzureMonitorWindowsAgent e selecione Habilitar atualização automática, se ainda não tiver sido feito.

      Captura de tela mostrando AzureMonitorWindowsAgent para habilitar a atualização automática.

  • Opção 3: reiniciar o AMA

    Siga estas etapas em todos os nós de cluster para reiniciar o AMA:

    1. Execute o seguinte comando para desativar o AMA:

      cd C:\Packages\Plugins\Microsoft.Azure.Monitor.AzureMonitorWindowsAgent\<agent version number>
      AzureMonitorAgentExtension.exe disable
      
    2. Depois que o executável for concluído e todos os processos do AMA forem interrompidos, execute o seguinte comando para reiniciar o agente:

      AzureMonitorAgentExtension.exe enable
      
  • Opção 4: reinicializar os nós do cluster

Reconfigurar o Insights para o Azure Stack HCI

Siga estas etapas para reconfigurar o Insights para Azure Stack HCI:

  1. No portal do Azure, a página Insights do cluster do Azure Stack HCI exibe uma faixa na parte superior, conforme mostrado na captura de tela a seguir, que ajuda você a configurar o Insights novamente e associar o DCR aos nós do cluster. Revise a faixa e selecione Configurar Insights.

    Captura de tela mostrando o botão Configurar Insights.

  2. Reconfigure DCR. Siga as instruções para configurar o Insights conforme fornecido neste artigo. Consulte Configurar insights para o Azure Stack HCI.

    Captura de tela da página Nova regra de coleta de dados.

Solucionar problemas de página de pastas de trabalho em branco sem dados preenchidos

Questão. Você verá uma página Pastas de Trabalho em branco sem dados preenchidos, conforme mostrado na captura de tela a seguir:

Captura de tela de uma página de pastas de trabalho em branco.

Possíveis causas. Pode haver várias causas possíveis para esse problema, incluindo configuração recente do Insights, etapas de solução de problemas incompletas para clusters registrados antes de novembro de 2023 ou DCR associado não configurado corretamente.

Solução. Para solucionar o problema, execute as seguintes etapas em sequência:

  1. Se você configurou recentemente o Insights, aguarde até uma hora para que o AMA colete dados.
  2. Se ainda não houver dados após a espera, verifique se você concluiu todas as etapas mencionadas na seção Solucionar problemas de clusters registrados antes de novembro de 2023 .
  3. Verifique a configuração do DCR associado. Certifique-se de que os canais de eventos e os contadores de desempenho sejam adicionados como fontes de dados ao DCR associado, conforme descrito na seção Regras de Coleta de Dados.
  4. Se o problema persistir após executar as etapas acima e você ainda não vir nenhum dado, entre em contato com o suporte ao cliente para obter assistência.

Para obter diretrizes de solução de problemas mais detalhadas, consulte Diretrizes de solução de problemas para o Agente do Azure Monitor.

Visualizações do Insights

Depois que o Insights estiver habilitado, as tabelas a seguir fornecerão detalhes sobre todos os recursos.

Integridade

Fornece falhas de integridade em um cluster.

Métrica Descrição Unidade Exemplo
Falha Uma breve descrição das falhas de saúde. Ao clicar no link, um painel lateral é aberto com mais informações. Nenhuma unidade PoolCapacityThresholdExceeded
Tipo de recurso com falha O tipo de recurso que encontrou uma falha. Nenhuma unidade Armazenamento
ID do recurso com falha ID exclusiva do recurso que encontrou uma falha de integridade. ID Exclusiva {a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1e1}: SP:{b1b1b1b1-cccc-dddd-eeee-f2f2f2f2f2f2f2}
Severidade A gravidade da falha pode ser um aviso ou crítica. Nenhuma unidade Aviso
Tempo de falha inicial Carimbo de data/hora de quando o servidor foi atualizado pela última vez. Datetime 09/04/2022 12:15:42

Servidor

Métrica Descrição Unidade Exemplo
Servidores Os nomes dos servidores no cluster. Nenhuma unidade VM-1
Última atualização A data e a hora em que o servidor foi atualizado pela última vez. Datetime 09/04/2022 12:15:42
Status A integridade dos recursos do servidor no cluster. Pode ser saudável, de advertência, crítico e outros Healthy
Uso da CPU A % de tempo que o processo usou a CPU. Percentual 56%
Uso de memória O uso de memória do processo do servidor é igual ao contador Process\Private Bytes mais o tamanho dos dados mapeados na memória. Percentual 16%
Processadores lógicos O número de processadores lógicos. Count 2
CPUs O número de CPUs. Count 2
Tempo de atividade O tempo durante o qual uma máquina, especialmente um computador, está em operação. Timespan 2.609 horas
Site O nome do site ao qual o servidor pertence. Nome do site Sítio A
Nome de domínio O domínio local ao qual o servidor pertence. Nenhuma unidade Contoso.local

Máquinas virtuais

Fornece o estado de todas as máquinas virtuais no cluster. Uma VM pode estar em um dos seguintes estados: Em execução, Parado, Com falha ou Outro (Desconhecido, Iniciando, Instantâneo, Salvando, Parando, Pausando, Retomando, Pausado, Suspenso).

Métrica Descrição Unidade Exemplo
Servidores O nome do servidor. Nenhuma unidade Exemplo-VM-1
Última Atualização Isso fornece a data e a hora de quando o servidor foi atualizado pela última vez Datetime 09/04/2022 12:24:02
Total de VMs O número de VMs em um nó de servidor. Count 0 de 0 em execução
Em execução O número de VMs em execução em um nó de servidor. Count 2
Interrompido O número de VMs paradas em um nó de servidor. Count 3
Com falha O número de VMs com falha em um nó de servidor. Count 2
Outro Se a VM estiver em um dos seguintes estados (Desconhecido, Iniciando, Instantâneo, Salvando, Parando, Pausando, Retomando, Pausado, Suspenso), ela será considerada como "Outro". Count 2

Armazenamento

A tabela a seguir fornece a integridade dos volumes e unidades no cluster:

Métrica Descrição Unidade Exemplo
Volumes O nome do volume Nenhuma unidade ClusterPerformanceHistory
Última atualização A data e a hora em que o armazenamento foi atualizado pela última vez. Datetime 14/04/2022 14:58:55
Status O status do volume. Saudável, aviso, crítico e outros. Healthy
Capacidade total A capacidade total do dispositivo em bytes durante o período do relatório. Bytes 2.5 GB
Capacidade disponível A capacidade disponível em bytes durante o período de relatório. Bytes 20 B
Iops Operações de entrada/saída por segundo. Por segundo 45/s
Taxa de transferência Número de bytes por segundo atendidos pelo Gateway de Aplicativo. Bytes por segundo 5B/s
Latência O tempo que leva para que a solicitação de E/S seja concluída. Second 0,0016 s
Resiliência A capacidade de se recuperar de falhas. Maximiza a disponibilidade dos dados. Nenhuma unidade Espelho de três vias
Eliminação de duplicação O processo de reduzir o número físico de bytes de dados que precisam ser armazenados no disco. Disponível ou não Sim/Não
Sistema de arquivos O tipo de sistema de arquivos. Nenhuma unidade ReFS

Preços do Azure Monitor

Quando você habilita a visualização de monitoramento, os logs são coletados de:

  • Gerenciamento de integridade (Microsoft-windows-health/operational).
  • Gerenciamento de SDDC (Microsoft-Windows-SDDC-Management/Operacional; ID do evento: 3000, 3001, 3002, 3003, 3004).

Você é cobrado com base na quantidade de dados ingeridos e nas configurações de retenção de dados do workspace do Log Analytics.

O Azure Monitor tem preços pagos conforme o uso e os primeiros 5 GB por conta de cobrança por mês são gratuitos. Como os preços podem variar devido a vários fatores, como a região do Azure que você está usando, visite a calculadora de preços do Azure Monitor para obter os cálculos de preços mais atualizados.

Próximas etapas