Monitorar um único cluster HCI do Azure Stack com o Insights
Aplica-se a: Azure Local, versão 22H2
Importante
O Azure Stack HCI agora faz parte do Azure Local. A renomeação da documentação do produto está em andamento. No entanto, as versões mais antigas do Azure Stack HCI, por exemplo 22H2, continuarão a fazer referência ao Azure Stack HCI e não refletirão a alteração de nome. Mais informações.
Este artigo explica como usar o Insights para monitorar um único cluster HCI do Azure Stack. Para vários clusters HCI do Azure Stack, consulte Monitorar vários clusters HCI do Azure Stack com o Insights.
O Insights é um recurso do Azure Monitor que rapidamente ajuda você a começar a monitorar seu cluster HCI do Azure Stack. Você pode exibir as principais métricas, integridade e informações de uso sobre cluster, servidores, máquinas virtuais e armazenamento.
Importante
Se você registrou seu cluster HCI do Azure Stack e configurou o Insights antes de novembro de 2023, determinados recursos que usam o Azure Monitor Agent (AMA), como Arc for Servers, VM Insights, Defender for Cloud ou Sentinel, podem não coletar logs e dados de eventos corretamente. Para obter orientações sobre solução de problemas, consulte a seção Solucionar problemas de clusters registrados antes de novembro de 2023 .
Benefícios
O Insights for Azure Stack HCI oferece os seguintes benefícios:
Gerenciado pelo Azure. O Insights é gerenciado pelo Azure e acessado por meio do portal do Azure, garantindo que esteja sempre atualizado. Não há necessidade de banco de dados ou configuração de software especial.
Escalabilidade. O Insights é capaz de carregar mais de 400 conjuntos de informações de cluster em várias assinaturas simultaneamente. Não há limitações de cluster, domínio ou localização física.
Personalização. A experiência do Insight é criada com base nos modelos de pasta de trabalho do Azure Monitor. Isso permite que você altere os modos de exibição e consultas, modifique ou defina limites que se alinham com seus limites específicos e, em seguida, salve essas personalizações em uma pasta de trabalho. Em seguida, você pode fixar gráficos nas pastas de trabalho nos painéis do Azure.
Configurar o Insights para o Azure Stack HCI
Os pré-requisitos e as configurações para usar o Insights variam dependendo da versão do Azure Stack HCI que você tem. Selecione uma das guias a seguir para obter instruções sobre como usar o Insights em sua versão específica do Azure Stack HCI.
O recurso Insights no Azure Stack HCI, versões 22H2 e posteriores, usa o AMA, que oferece vantagens significativas em comparação com o Microsoft Monitoring Agent (MMA) herdado usado no Azure Stack HCI, versão 21H2 e anteriores. Essas vantagens incluem velocidade aprimorada, segurança aprimorada e desempenho superior. Você pode integrar novos nós ao AMA ou migrar os nós existentes do agente herdado para o AMA.
Recomendamos que você atualize seu sistema Azure Stack HCI para a versão 22H2 ou posterior para aproveitar a experiência do Insights com a AMA.
A partir da atualização cumulativa de maio de 2023 para o Azure Stack HCI, versão 22H2, você pode monitorar sistemas HCI do Azure Stack locais com o Insights for Azure Stack HCI.
Pré-requisitos
Aqui estão os pré-requisitos para usar o Insights for Azure Stack HCI:
O cluster HCI do Azure Stack deve ser registrado com o Azure e habilitado para Arc. Se você registrou seu cluster em ou após 15 de junho de 2021, isso acontece por padrão. Caso contrário, você deve habilitar a integração do Azure Arc.
O cluster deve ter o Azure Stack HCI, versão 22H2 e a atualização cumulativa de maio de 2023 ou posterior instalada.
A identidade gerenciada para o recurso do Azure deve ser habilitada. Para obter mais informações, consulte Gerenciamento avançado habilitado.
Ativar Insights
A habilitação do Insights ajuda você a monitorar todos os clusters HCI do Azure Stack atualmente associados ao espaço de trabalho do Log Analytics fornecendo métricas de integridade úteis. O Insights instala o Azure Monitor Agent e ajuda você a configurar regras de coleta de dados (DCRs) para monitorar seu cluster HCI do Azure Stack.
Para habilitar esse recurso do portal do Azure, siga estas etapas:
No portal do Azure, navegue até a página de recursos de cluster HCI do Azure Stack e selecione seu cluster. Na guia Recursos, selecione Insights.
Na página Insights, selecione Introdução.
Nota
O botão Introdução está disponível apenas para o Azure Stack HCI, versão 22H2 com a atualização cumulativa de maio de 2023 ou posterior instalada e somente depois que a identidade gerenciada estiver habilitada. Caso contrário, este botão será desativado.
Na página Configuração do Insights , selecione um DCR existente na lista suspensa Regra de coleta de dados. O DCR especifica os logs de eventos e contadores de desempenho que precisam ser coletados e os armazena em um espaço de trabalho do Log Analytics. O Insights cria um DCR padrão, caso ainda não exista. Apenas os DCRs habilitados para o Insights são incluídos.
(Opcional) Você também pode criar um novo DCR selecionando Criar novo na página de configuração do Insights.
Importante
Recomendamos vivamente que não crie o seu próprio DCR. O DCR criado pela Insights inclui um fluxo de dados especial necessário para sua operação. Você pode editar esse DCR para coletar mais dados, como eventos do Windows e Syslog. Os DCRs criados através da instalação AMA terão um prefixo
AzureStackHCI-
anexado com o nome DCR.Na página Nova regra de coleta de dados, especifique a assinatura, o nome DCR e o nome do ponto de extremidade de coleta de dados (DCE). Os DCEs são usados para acessar o serviço de configuração para buscar DCRs associados para o Azure Monitor Agent. Para obter mais informações sobre DCE, consulte Pontos de extremidade de coleta de dados no Azure Monitor.
Nota
Se você estiver usando links privados no agente, deverá adicionar DCEs. Para obter mais informações sobre as configurações de rede AMA, consulte Definir configurações de rede do Azure Monitor Agent.
Selecione o botão Rever + criar.
Se um DCR ainda não tiver sido criado para o cluster não monitorado, será criado um com contadores de desempenho habilitados e o canal de log de eventos do Windows habilitado.
Analise a tela final com um resumo do nome DCR, número de logs de eventos, contadores de desempenho e nome do espaço de trabalho do Log Analytics no qual os dados são armazenados. Selecione Configurar.
Depois de selecionar Configurar, você será redirecionado para a página Extensões , onde poderá ver o status da instalação do agente. Ao configurar o Insights, o AMA é instalado automaticamente em todos os nós do cluster.
Vá para a página de recursos de cluster HCI do Azure Stack e selecione seu cluster. O Insights agora é exibido como Configurado na guia Recursos :
Regras da recolha de dados
Ao habilitar o Insights em uma máquina com o Azure Monitor Agent, você deve especificar um DCR a ser usado. Para obter mais informações sobre DCRs, consulte Regras de coleta de dados no Azure Monitor.
Opção | Descrição |
---|---|
Contadores de Desempenho | Especifica quais contadores de desempenho de dados devem ser coletados do sistema operacional. Esta opção é necessária para todos os computadores. Esses contadores de desempenho são usados para preencher as visualizações na pasta de trabalho do Insights. Atualmente, a pasta de trabalho do Insights usa cinco contadores de desempenho - Memory()\Available Bytes , Network Interface()\Bytes Total/sec , Processor(_Total)\% Processor Time , RDMA Activity()\RDMA Inbound Bytes/sec e RDMA Activity()\RDMA Outbound Bytes/sec |
Canal de Log de Eventos | Especifica quais logs de eventos do Windows devem ser coletados do sistema operacional. Esta opção é necessária para todos os computadores. Os logs de eventos do Windows são usados para preencher as visualizações na pasta de trabalho do Insights. Atualmente, os dados são coletados por meio de dois canais de log de eventos do Windows: - microsoft-windows-health/operational e ainda microsoft-windows-sddc-management/operational |
Área de trabalho do Log Analytics | Espaço de trabalho para armazenar os dados. Apenas espaços de trabalho com o Insights são listados. |
Canal do evento
O Microsoft-windows-sddc-management/operational
canal de eventos e Microsoft-windows-health/operational
do Windows é adicionado ao seu espaço de trabalho do Log Analytics em logs de eventos do Windows.
Ao coletar esses logs, o Insights mostra o status de integridade dos servidores, unidades, volumes e VMs individuais. Por padrão, cinco contadores de desempenho são adicionados.
Contadores de desempenho
Por padrão, cinco contadores de desempenho são adicionados:
A tabela a seguir descreve os contadores de desempenho monitorados:
Contadores de desempenho | Description |
---|---|
Memória(*)\Bytes disponíveis | Bytes disponíveis é a quantidade de memória física, em bytes, imediatamente disponível para alocação em um processo ou para uso do sistema. |
Interface de Rede(*)\Total de Bytes/seg. | A taxa na qual os bytes são enviados e recebidos em cada adaptador de rede, incluindo caracteres de enquadramento. Total de bytes/s é uma soma de bytes recebidos/s e bytes enviados/seg. |
Processor(_Total)% Tempo do processador | A porcentagem de tempo decorrido que todos os threads de processo usaram o processador para instruções de execução. |
Atividade RDMA(*)\Bytes de entrada RDMA/s | Taxa de dados recebidos através de RDMA pelo adaptador de rede por segundo. |
Atividade RDMA(*)\RDMA Bytes de Saída/s | Taxa de dados enviados através de RDMA pelo adaptador de rede por segundo. |
Depois de ativar o Insights, pode levar até 15 minutos para coletar os dados. Quando o processo estiver concluído, você poderá ver uma visualização rica da integridade do cluster no menu Informações no painel esquerdo :
Desativar Insights
Para desativar o Insights, siga estas etapas:
Quando você desabilita o recurso Insights, a associação entre a regra de coleta de dados e o cluster é excluída e os logs do Serviço de Integridade e do Gerenciamento de SDDC não são mais coletados; no entanto, os dados existentes não são excluídos. Se você quiser excluir esses dados, vá para o espaço de trabalho DCR e Log Analytics e exclua os dados manualmente.
Atualizar informações
O bloco Insights mostra uma mensagem de atualização Precisa nos seguintes casos:
- Uma regra de coleta de dados é alterada.
- Um evento de integridade do log de eventos do Windows é excluído.
- Qualquer um dos cinco contadores de desempenho do espaço de trabalho do Log Analytics é excluído.
Para habilitar o Insights novamente, siga estas etapas:
Migrar do Microsoft Monitoring Agent
Para migrar do Microsoft Monitoring Agent (MMA) para o Azure Monitoring Agent (AMA), role para baixo até Insights.
Selecione Instalar AMA, a janela de configuração do Insights é aberta.
Selecione ou crie uma regra de coleta de dados conforme descrito anteriormente na seção Habilitar Insights .
O Azure Monitor Agent e a extensão do Microsoft Monitoring Agent podem ser instalados no mesmo computador durante a migração. A execução de ambos os agentes pode levar à duplicação de dados e ao aumento dos custos. Se uma máquina tiver os dois agentes instalados, você verá um aviso no portal do Azure de que pode estar coletando dados duplicados, conforme mostrado na captura de tela a seguir.
Aviso
A coleta de dados duplicados de uma única máquina com o Agente do Azure Monitor e a extensão do Microsoft Monitoring Agent pode resultar em custo de ingestão extra do envio de dados duplicados para o espaço de trabalho do Log Analytics.
Você mesmo deve remover a extensão do Microsoft Monitoring Agent de todos os computadores que a estejam usando. Antes de executar esta etapa, verifique se o computador não está confiando em nenhuma outra solução que exija o Microsoft Monitoring Agent. Depois de verificar se o MicrosoftMonitoringAgent ainda não está conectado ao seu espaço de trabalho do Log Analytics, você pode remover o MicrosoftMonitoringAgent manualmente redirecionando para a página Extensões .
Resolver problemas
Esta seção fornece orientação para resolver os problemas com o uso do Insights for Azure Stack HCI.
Solucionar problemas de clusters registrados antes de novembro de 2023
Questão. Em clusters registrados antes de novembro de 2023, os recursos que usam o AMA no Azure Stack HCI, como Arc for Servers, VM Insights, Container Insights, Defender for Cloud e Sentinel, podem não coletar logs e dados de eventos corretamente.
Causa. Antes de novembro de 2023, o registro de cluster configurava o AMA para usar a identidade do cluster, enquanto os serviços que usam o AMA no Azure Stack HCI exigiam a identidade do nó do cluster para a coleta de log adequada. Essa incompatibilidade resultou na coleta inadequada de logs desses serviços.
Solução. Para resolver esse problema, fizemos uma alteração no registro de cluster HCI para AMA para usar a identidade do servidor. Para implementar essa alteração, execute as seguintes etapas em clusters registrados antes de novembro de 2023:
- Reparar o registro de cluster. Consulte Reparar registro de cluster.
- Reparação AMA. Consulte Reparar AMA.
- Reconfigure o Insights para o Azure Stack HCI. Consulte Reconfigurar o Insights para o Azure Stack HCI.
No portal do Azure, a página HCI do Insights for Azure Stack deteta automaticamente a alteração na configuração do AMA e exibe um banner na parte superior da página, orientando você a tomar as ações necessárias para continuar usando serviços que dependem da AMA.
Reparar o registro de cluster
Siga estas etapas para reparar o registro do cluster:
Nos nós do cluster, instale o módulo PowerShell mais recente
Az.StackHCI
. Substitualatestversion
pelo número da versão mais recenteAz.StackHCI
.Install-Module -Name Az.StackHCI -RequiredVersion {latestversion} -Scope CurrentUser -Repository PSGallery -Force
Execute o comando repair registration para remover regkey:
Register-AzStackHCI -TenantId {TenantID} -SubscriptionId {subscriptionID} -ComputerName {NodeName} -RepairRegistration
Reparar AMA para Azure Stack HCI
Escolha uma das seguintes opções para reparar o AMA:
Opção 1: Desinstalar o AMA
Se o AMA já estiver atualizado, desinstale-o. Siga estes passos para desinstalar o AMA:
Opção 2: Atualizar AMA
Siga estas etapas para atualizar o AMA:
Opção 3: Reiniciar o AMA
Siga estas etapas em todos os nós do cluster para reiniciar o AMA:
Execute o seguinte comando para desativar o AMA:
cd C:\Packages\Plugins\Microsoft.Azure.Monitor.AzureMonitorWindowsAgent\<agent version number> AzureMonitorAgentExtension.exe disable
Depois que o executável for concluído e todos os processos AMA pararem, execute o seguinte comando para reiniciar o agente:
AzureMonitorAgentExtension.exe enable
Opção 4: Reinicializar os nós do cluster
Reconfigurar o Insights para o Azure Stack HCI
Siga estas etapas para reconfigurar o Insights for Azure Stack HCI:
No portal do Azure, a página Insights do cluster HCI do Azure Stack exibe um banner na parte superior, conforme mostrado na captura de tela a seguir, que ajuda você a configurar o Insights novamente e associar o DCR aos nós do cluster. Revise o banner e selecione Configurar Insights.
Reconfigure DCR. Siga as instruções para configurar o Insights, conforme fornecido neste artigo. Consulte Configurar o Insights para o Azure Stack HCI.
Solucionar problemas de páginas de pastas de trabalho em branco sem dados preenchidos
Questão. Você verá uma página de pastas de trabalho em branco sem dados preenchidos, conforme mostrado na captura de tela a seguir:
Possíveis causas. Pode haver várias causas possíveis para esse problema, incluindo configuração recente do Insights, etapas de solução de problemas incompletas para clusters registrados antes de novembro de 2023 ou DCR associado não configurado corretamente.
Solução. Para solucionar o problema, execute as seguintes etapas em sequência:
- Se você configurou recentemente o Insights, aguarde até uma hora para que o AMA colete dados.
- Se ainda não houver dados depois de esperar, certifique-se de ter concluído todas as etapas mencionadas na seção Solucionar problemas de clusters registrados antes de novembro de 2023 .
- Verifique a configuração do DCR associado. Certifique-se de que os canais de eventos e os contadores de desempenho sejam adicionados como fontes de dados ao DCR associado, conforme descrito na seção Regras de Coleta de Dados.
- Se o problema persistir depois de executar as etapas acima e você ainda não vir nenhum dado, entre em contato com o suporte ao cliente para obter assistência.
Para obter orientações de solução de problemas mais detalhadas, consulte Diretrizes de solução de problemas para o Azure Monitor Agent.
Visualizações de insights
Depois que o Insights estiver habilitado, as tabelas a seguir fornecerão detalhes sobre todos os recursos.
Saúde
Fornece falhas de integridade em um cluster.
Métrico | Description | Unit | Exemplo |
---|---|---|---|
Falha | Uma breve descrição das falhas de saúde. Ao clicar no link, um painel lateral é aberto com mais informações. | Sem unidade | PoolCapacityThresholdExceeded |
Tipo de recurso com falha | O tipo de recurso que encontrou uma falha. | Sem unidade | Armazenamento |
ID do recurso com falha | ID exclusiva para o recurso que encontrou uma falha de integridade. | ID Único | {a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1}: SP:{b1b1b1b1-cccc-dddd-eeee-f2f2f2f2f2} |
Gravidade | A gravidade da falha pode ser de aviso ou crítica. | Sem unidade | Aviso |
Tempo de falha inicial | Carimbo de data/hora de quando o servidor foi atualizado pela última vez. | Datetime | 9/4/2022, 12:15:42 |
Servidor
Métrico | Description | Unit | Exemplo |
---|---|---|---|
Servidores | Os nomes dos servidores no cluster. | Sem unidade | VM-1 |
Última atualização | A data e a hora de quando o servidor foi atualizado pela última vez. | Datetime | 9/4/2022, 12:15:42 |
Status | A integridade dos recursos do servidor no cluster. | Pode ser saudável, alerta, crítico e outros | Bom estado de funcionamento |
Utilização da CPU | A % de tempo que o processo usou a CPU. | Percentagem | 56% |
Utilização de memória | O uso de memória do processo do servidor é igual ao contador Process\Private Bytes mais o tamanho dos dados mapeados na memória. | Percentagem | 16% |
Processadores lógicos | O número de processadores lógicos. | Count | 2 |
CPUs | O número de CPUs. | Count | 2 |
Tempo de Atividade | O tempo durante o qual uma máquina, especialmente um computador, está em funcionamento. | Timespan | 2.609 horas. |
Site | O nome do site ao qual o servidor pertence. | Nome do site | Sítio A |
Nome de domínio | O domínio local ao qual o servidor pertence. | Sem unidade | Contoso.local |
Máquinas virtuais
Fornece o estado de todas as máquinas virtuais no cluster. Uma VM pode estar em um dos seguintes estados: Em execução, Parada, Falha ou Outro (Desconhecido, Iniciando, Snapshotting, Salvando, Parando, Pausando, Retomando, Pausado, Suspenso).
Métrico | Description | Unit | Exemplo |
---|---|---|---|
Servidores | O nome do servidor. | Sem unidade | Exemplo-VM-1 |
Última Actualização | Isso fornece a data e a hora de quando o servidor foi atualizado pela última vez | Datetime | 09/04/2022, 12:24:02 |
Total VMs | O número de VMs em um nó de servidor. | Count | 0 de 0 em execução |
Em Execução | O número de VMs em execução em um nó de servidor. | Count | 2 |
Parado | O número de VMs paradas em um nó de servidor. | Count | 3 |
Com falhas | O número de VMs falhou em um nó do servidor. | Count | 2 |
Outro | Se a VM estiver em um dos seguintes estados (Desconhecido, Iniciando, Instantâneo, Salvando, Parando, Pausando, Retomando, Pausado, Suspenso), ela será considerada como "Outros". | Count | 2 |
Armazenamento
A tabela a seguir fornece a integridade de volumes e unidades no cluster:
Métrico | Description | Unit | Exemplo |
---|---|---|---|
Volumes | O nome do volume | Sem unidade | ClusterPerformanceHistory |
Última atualização | A data e a hora em que o armazenamento foi atualizado pela última vez. | Datetime | 14/4/2022, 14:58:55 |
Status | O status do volume. | Saudável, alerta, crítico e outros. | Bom estado de funcionamento |
Capacidade total | A capacidade total do dispositivo em bytes durante o período de relatório. | Bytes | 2,5 GB |
Capacidade disponível | A capacidade disponível em bytes durante o período de relatório. | Bytes | 20 B |
Iops | Operações de entrada/saída por segundo. | Por segundo | 45/s |
Débito | Número de bytes por segundo que o Application Gateway atendeu. | Bytes por segundo | 5B/s |
Latência | O tempo necessário para que a solicitação de E/S seja concluída. | Second | 0,0016 s |
Resiliência | A capacidade de recuperação de falhas. Maximiza a disponibilidade dos dados. | Sem unidade | Espelho de três vias |
Eliminação de duplicados | O processo de redução do número físico de bytes de dados que precisam ser armazenados no disco. | Disponível ou não | Sim/Não |
Sistema de ficheiros | O tipo de sistema de arquivos. | Sem unidade | ReFS |
Preços do Azure Monitor
Quando você habilita a visualização de monitoramento, os logs são coletados de:
- Gerenciamento de integridade (Microsoft-windows-health/operational).
- Gerenciamento SDDC (Microsoft-Windows-SDDC-Management/Operacional; ID do evento: 3000, 3001, 3002, 3003, 3004).
Você é cobrado com base na quantidade de dados ingeridos e nas configurações de retenção de dados do seu espaço de trabalho do Log Analytics.
O Azure Monitor tem preços pré-pagos e os primeiros 5 GB por conta de faturação por mês são gratuitos. Como o preço pode variar devido a vários fatores, como a região do Azure que você está usando, visite a calculadora de preços do Azure Monitor para obter os cálculos de preços mais atualizados.