Partilhar via


Avaliar a integridade do cluster AKS

Este artigo faz parte de uma série. Comece com a visão geral.

Para iniciar sua prática de triagem, avalie a integridade geral do cluster e da rede.

Ferramentas

Há muitas ferramentas e recursos que você pode usar para diagnosticar e resolver problemas em seu cluster do Serviço Kubernetes do Azure (AKS).

No portal do Azure, selecione seu recurso de cluster AKS. Essas ferramentas e recursos estão no painel de navegação.

  • Diagnosticar e resolver problemas: você pode usar essa ferramenta para ajudar a identificar e resolver problemas em seu cluster.

  • Integridade do recurso: você pode usar essa ferramenta para ajudar a diagnosticar e obter suporte para problemas de serviço que podem afetar seus recursos do Azure. Esta ferramenta fornece informações sobre o estado de saúde atual e passado dos seus recursos.

  • Recomendações do Advisor: o Azure Advisor atua como um consultor de nuvem personalizado, orientando você a seguir as práticas recomendadas para otimizar suas implantações do Azure. Você pode usar o Advisor para analisar a configuração de recursos e a telemetria de uso. O Advisor sugere soluções para que você possa melhorar a relação custo-benefício, o desempenho, a confiabilidade e a segurança.

  • Logs: use esse recurso para acessar os logs e métricas de cluster armazenados no espaço de trabalho do Log Analytics . Você pode monitorar e analisar os logs e métricas do cluster para fornecer informações e melhorar a solução de problemas.

Use essas ferramentas e recursos para que você possa diagnosticar e resolver problemas com eficiência, otimizar sua implantação de cluster AKS e monitorar a integridade e o desempenho de seus recursos do Azure.

Diagnosticar e resolver problemas

O recurso diagnosticar e resolver problemas fornece um conjunto abrangente de ferramentas para ajudar na identificação e resolução de vários problemas relacionados ao seu cluster. Selecione a categoria de solução de problemas mais relevante para o seu problema.

Screenshot that shows the Diagnose and solve problems page.

Para verificar a integridade do cluster, você pode escolher:

  • Disponibilidade e desempenho do cluster e do plano de controle: verifique se há algum problema de disponibilidade ou limitação do serviço que afete a integridade do cluster.
  • Problemas de conectividade: verifique se há erros com a resolução do DNS (Sistema de Nomes de Domínio) do cluster ou se a rota de comunicação de saída tem problemas de conectividade.

Estado de funcionamento de recursos

Use o recurso de integridade do recurso para identificar e obter suporte para problemas de cluster e problemas de serviço que podem afetar a integridade do cluster. Configure um alerta de recurso para que você possa monitorar facilmente a integridade do cluster. O recurso de integridade do recurso fornece um relatório sobre a integridade atual e passada do cluster. Existem quatro estados de saúde:

  • Disponível: esse status indica que não há eventos detetados que afetem a integridade do cluster. Se o cluster tiver se recuperado de um tempo de inatividade não planejado nas últimas 24 horas, uma notificação resolvida recentemente será exibida.

  • Indisponível: esse status indica que um evento de plataforma ou não plataforma em andamento que afeta a integridade do cluster foi detetado.

  • Desconhecido: esse status indica que o recurso não recebeu nenhuma informação sobre o recurso por mais de 10 minutos. Esse status geralmente aparece quando uma máquina virtual é deslocalizada. Esse status não é uma indicação definitiva do estado do recurso, mas pode ser um ponto de dados útil para a solução de problemas.

  • Degradado: esse status indica que há uma perda de desempenho para o cluster, mas o cluster ainda está disponível para uso.

A captura de tela a seguir mostra a visão geral da integridade do recurso.

Screenshot that shows the AKS resource health overview.

Para obter mais informações, consulte Visão geral da integridade dos recursos do Azure.

Assistente

O Advisor fornece recomendações práticas para ajudá-lo a otimizar seus clusters AKS para confiabilidade, segurança, excelência operacional e eficiência de desempenho. Você pode usar o Advisor para melhorar proativamente o desempenho do cluster e evitar possíveis problemas. Selecione uma recomendação para obter informações detalhadas sobre como otimizar seu cluster.

Screenshot that shows the Advisor for AKS result with actions.

A captura de tela a seguir mostra os recursos para a recomendação selecionada.

Screenshot that shows the Advisor for AKS result sample 2. Para obter mais informações, consulte Visão geral do Advisor.

Log Analytics

O Log Analytics fornece informações sobre a integridade do cluster. Para aceder à área de trabalho do Log Analytics, aceda ao cluster AKS e selecione Registos no painel de navegação.

Você pode escolher consultas predefinidas para analisar a integridade do cluster.

Screenshot that shows queries.

Use consultas internas para consultar logs e métricas coletadas no espaço de trabalho do Log Analytics. A lista a seguir descreve as funções de algumas das consultas nas categorias de disponibilidade, logs de contêiner e diagnóstico.

  • Disponibilidade

    • Status de prontidão por consulta de nó: exiba a contagem de todos os nós no cluster pelo status de prontidão.

    • Listar toda a contagem de pods com consulta de fase: Visualize a contagem de todos os pods por fase , como falha, pendente, desconhecido, em execução ou bem-sucedido.

  • Logs de contêiner

    • Localizar um valor na consulta Tabela de Logs de Contêiner: localize linhas na tabela ContainerLogs onde LogEntry tem um parâmetro de cadeia de caracteres especificado.

    • Listar logs de contêiner por consulta de namespace : exiba logs de contêiner dos namespaces no cluster.

  • Diagnóstico

    • Consulta de logs do Autoscaler de cluster: consulta de logs do autoscaler de cluster. Essa consulta pode fornecer informações sobre por que o cluster aumenta ou diminui inesperadamente.

    • Consulta de logs do servidor de API do Kubernetes: consulta de logs do servidor de API do Kubernetes.

    • Consulta de inventário de imagens: liste todas as imagens de contêiner e seu status.

    • Prometheus disk read per second per node query: Visualize as métricas de leitura de disco Prometheus do namespace Kubernetes padrão como um timechart.

    • Instances Avg CPU usage growth from last week query: Mostre o crescimento médio da CPU por instância na semana passada, em ordem decrescente.

Contribuidores

Este artigo é mantido pela Microsoft. Foi originalmente escrito pelos seguintes contribuidores.

Principais autores:

Outros contribuidores:

  • Rong Zhang - Brasil | Gerente de Produto Sênior

Para ver perfis não públicos do LinkedIn, inicie sessão no LinkedIn.