Partilhar via


Monitorar a saúde e os alertas no Azure Stack Hub

O Azure Stack Hub inclui capacidades de monitorização de infraestrutura que ajudam a visualizar o estado e os alertas de uma região do Azure Stack Hub. O bloco de gerenciamento da Região lista todas as regiões implantadas do Azure Stack Hub. Está fixado por predefinição no portal do administrador para a Subscrição de Provedor Padrão. O bloco mostra o número de alertas críticos e de aviso ativos para cada região. O azulejo é o seu ponto de entrada na funcionalidade de saúde e alerta do Azure Stack Hub.

O bloco Gerenciamento de Região no portal do administrador do Azure Stack Hub

Compreender a saúde no Azure Stack Hub

O fornecedor de recursos de saúde gere a saúde e os alertas. Os componentes de infraestrutura do Azure Stack Hub registam-se com o provedor de recursos de integridade de saúde durante a implantação e configuração do Azure Stack Hub. Esse registro permite a exibição de saúde e alertas para cada componente. A saúde no Azure Stack Hub é um conceito simples. Se existirem alertas para uma instância registada de um componente, o estado de saúde desse componente refletirá a pior gravidade de alerta ativo: aviso ou crítico.

Definição de gravidade do alerta

O Azure Stack Hub gera alertas com apenas duas gravidades: aviso e crítico.

  • Aviso
    Um operador pode tratar o alerta de forma programada. O alerta normalmente não afeta as cargas de trabalho do usuário.

  • Crítica
    O operador deve tratar o alerta crítico com urgência. Esses alertas indicam problemas que atualmente afetam ou afetarão em breve os usuários do Azure Stack Hub.

Exibir e gerenciar o estado de integridade do componente

Você pode exibir o estado de integridade dos componentes no portal do administrador e por meio da API REST e do PowerShell.

Para visualizar o estado de saúde no portal, clique na região que deseja visualizar no bloco Gerenciamento da Região . Você pode exibir o estado de integridade das funções de infraestrutura e dos provedores de recursos.

Lista de funções de infraestrutura

Você pode clicar em um provedor de recursos ou função de infraestrutura para exibir informações mais detalhadas.

Advertência

Se clicar num papel de infraestrutura, e depois clicar na instância do papel, tem opções para Iniciar, Reiniciarou Desligar. Não use essas ações ao aplicar atualizações a um sistema integrado. Além disso, não usar essas opções em um ambiente ASDK (Azure Stack Development Kit). Essas opções são projetadas apenas para um ambiente de sistemas integrados, onde há mais de uma instância de função por função de infraestrutura. Reiniciar uma instância de função (especialmente AzS-Xrp01) no ASDK causa instabilidade no sistema. Para obter assistência na solução de problemas, publique seu problema no fórum do Azure Stack Hub.

Ver alertas

A lista de alertas ativos para cada região do Azure Stack Hub está disponível diretamente na folha de gerenciamento da Região. O primeiro bloco na configuração padrão é o bloco Alertas, que exibe um resumo dos alertas críticos e de aviso para a região. Você pode fixar o bloco Alertas, como qualquer outro bloco nesta interface, no painel para um acesso mais fácil.

painel de Alertas que mostra um aviso no portal de administrador do Azure Stack Hub

Para exibir uma lista de todos os alertas ativos para a região, selecione a parte superior do bloco Alertas. Para ver uma lista filtrada de alertas (Crítico ou Aviso), selecione o item de linha Crítico ou Aviso dentro do bloco.

A lâmina Alertas permite filtrar tanto para o estado (Ativo ou Fechado) quanto para a gravidade (Crítico ou Aviso). O modo de exibição padrão exibe todos os alertas ativos. Todos os alertas fechados são removidos do sistema após sete dias.

Observação

Se um alerta permanecer ativo, mas não tiver sido atualizado em mais de um dia, você poderá executar Test-AzureStack e fechá-lo se nenhum problema for relatado.

painel de filtro para filtrar por estado crítico ou de aviso no Portal do Administrador do Azure Stack Hub

A ação de visualização da API exibe a API REST que foi usada para gerar a exibição de lista. Esta ação fornece uma maneira rápida de se familiarizar com a sintaxe da API REST que você pode usar para consultar alertas. Você pode usar essa API na automação ou para integração com suas soluções existentes de monitoramento, emissão de relatórios e emissão de tíquetes de datacenter.

Você pode clicar em um alerta específico para exibir os detalhes do alerta. Os detalhes do alerta mostram todos os campos associados ao alerta e permitem uma navegação rápida para o componente afetado e a fonte do alerta. Por exemplo, o alerta a seguir ocorre se uma das instâncias de função de infraestrutura ficar offline ou não estiver acessível.

A folha Detalhes do alerta no portal do administrador do Azure Stack Hub

Remediação de alertas

Remediação automatizada

Alguns alertas suportam uma opção Reparar, como mostrado na imagem anterior. Quando selecionada, a ação Reparar executa etapas específicas do alerta para tentar resolver o problema. Uma vez selecionada, o status da ação Reparar estará disponível como uma notificação do portal.

A ação de alerta de reparação está em andamento

A ação Reparar relatará a conclusão bem-sucedida ou a falha na conclusão da ação na mesma folha de notificação do portal. Se uma ação de reparação falhar para um alerta, poderá repetir a ação Reparar a partir dos detalhes do alerta. Se a ação Reparar for concluída com êxito, não executar novamente a ação Reparar ação. Depois que a instância de função de infraestrutura estiver online novamente, esse alerta será fechado automaticamente.

A ação de reparação é concluída com êxito

Remediação manual

Se a opção Repair não for suportada, siga o conjunto completo de instruções de correção fornecidas no alerta. Como exemplo, as etapas internas de correção de expiração de certificado irão guiá-lo pelo processo de rotação secreta:

Remediação de expiração de certificado

Encerramento do alerta

Muitos, mas não todos os alertas, serão fechados automaticamente quando o problema subjacente for resolvido. Os alertas que fornecem um botão de ação de reparo serão fechados automaticamente se o Azure Stack Hub resolver o problema. Para todos os outros alertas, selecione Fechar Alerta depois de executar as etapas de correção. Se o problema persistir, o Azure Stack Hub gerará um novo alerta. Se você resolver o problema, o alerta permanecerá fechado e não exigirá mais etapas.

Próximos passos

Gerenciar atualizações no Azure Stack Hub

Gerenciamento de região no Azure Stack Hub