Monitorar o Azure HDInsight
Este artigo descreve:
- Os tipos de dados de monitoramento que você pode coletar para esse serviço.
- Maneiras de analisar esses dados.
Observação
Se já estiver familiarizado com esse serviço e/ou com o Azure Monitor e apenas quiser saber como analisar os dados de monitoramento, confira a seção Analisar ao final deste artigo.
Quando seus aplicativos e processos de negócios críticos dependem de recursos do Azure, você precisa monitorar e receber alertas para o seu sistema. O serviço do Azure Monitor coleta e agrega métricas e logs de cada componente do seu sistema. O Azure Monitor lhe fornece uma exibição da disponibilidade, desempenho e resiliência e notifica você em caso de problemas. Você pode usar o portal do Azure, o PowerShell, a CLI do Azure, a API REST ou as bibliotecas de cliente para configurar e exibir dados de monitoramento.
- Para obter mais informações sobre o Azure Monitor, confira a Visão geral do Azure Monitor.
- Para obter mais informações sobre como monitorar os recursos do Azure de modo geral, confira Monitorar os recursos do Azure com o Azure Monitor.
Opções de monitoramento do HDInsight
As métricas e os logs específicos disponíveis para o cluster HDInsight dependem do tipo de cluster e das ferramentas. O Azure HDInsight oferece os tipos de cluster Apache Hadoop, Spark, Kafka, HBase e Interactive Query. Você pode monitorar seu cluster por meio da IU da Web do Apache Ambari ou no portal do Azure habilitando a integração do Azure Monitor.
Monitoramento do Apache Ambari
O Apache Ambari simplifica o gerenciamento, a configuração e o monitoramento de clusters HDInsight, fornecendo uma IU da Web e uma API REST. O Ambari está incluído em todos os clusters HDInsight baseados em Linux. Para usar o Ambari, selecione a Página inicial do Ambari na página de Visão geral do cluster HDInsight no portal do Azure.
Para obter informações sobre como usar o Ambari para monitoramento, confira os seguintes artigos:
- Monitorar o desempenho do cluster no Azure HDInsight
- Como monitorar a disponibilidade do cluster com o Apache Ambari no Azure HDInsight
Integração com o Azure Monitor
Você também pode monitorar seus clusters HDInsight diretamente no Azure. Uma nova integração do Azure Monitor, agora em versão prévia, permite acessar Insights, Logs e Pastas de trabalho do cluster HDInsight sem a necessidade de invocar o workspace do Log Analytics.
Para usar a nova integração do Azure Monitor, habilite-a selecionando a integração do Monitor, na seção Monitoramento, no menu à esquerda da página do portal do Azure HDInsight. Você também pode usar o PowerShell ou a CLI do Azure para habilitar e interagir com a nova integração de monitoramento. Para obter mais informações, consulte o seguinte artigo:
Insights
Alguns serviços no Azure têm um painel de monitoramento integrado no portal do Azure que fornece um ponto de partida para monitorar seu serviço. Esses painéis são chamados de insights e você pode encontrá-los no Hub de Insights do Azure Monitor no portal do Azure.
Integração do portal do cluster de insights
Depois de habilitar a integração do Azure Monitor, você poderá selecionar Insights (Versão prévia) no menu esquerdo da página do portal do Azure HDInsight para ver um painel de visualização de métricas e logs preenchidos automaticamente específico ao tipo do cluster. O painel de insights usa uma Pasta de trabalho do Azure predefinida que tem seções para cada tipo de cluster, YARN, métricas do sistema e logs de componentes.
Esses grafos e visualizações detalhados fornecem insights profundos sobre o desempenho e a integridade do cluster. Para obter mais informações, confira Usar insights do HDInsight prontos para uso para monitorar um único cluster.
Tipos de recurso
O Azure usa o conceito de tipos de recursos e IDs para identificar tudo em uma assinatura. Os tipos de recurso também fazem parte das IDs de recursos para cada recurso em execução no Azure. Por exemplo, um tipo de recurso para uma máquina virtual é Microsoft.Compute/virtualMachines
. Para obter uma lista de serviços e os tipos de recursos associados a eles, confira Provedores de recursos.
O Azure Monitor organiza os principais dados de monitoramento de maneira similar em métricas e logs com base em tipos de recursos, também chamados de namespaces. Métricas e logs diferentes estão disponíveis para diferentes tipos de recursos. Seu serviço pode estar associado a mais de um tipo de recurso.
Para obter mais informações sobre os tipos de recursos do Azure HDInsight, confira Referência de dados de monitoramento do HDInsight.
Armazenamento de dados
Para o Azure Monitor:
- Os dados de métricas são armazenados no banco de dados de métricas do Azure Monitor.
- Os dados de log são armazenados no repositório de logs do Azure Monitor. O Log Analytics é uma ferramenta no portal do Azure que pode consultar esse repositório.
- O log de atividades do Azure é um repositório separado com uma interface própria no portal do Azure.
Opcionalmente, você pode rotear dados de log de métricas e atividades para o armazenamento de logs do Azure Monitor. Em seguida, você pode usar o Log Analytics para consultar os dados e correlacioná-los com outros dados de log.
Muitos serviços podem usar configurações de diagnóstico para enviar dados de métricas e logs para outros locais de armazenamento fora do Azure Monitor. Os exemplos incluem o Armazenamento do Azure, sistemas de parceiros hospedados e sistemas de parceiros não Azure, usando Hubs de Eventos.
Para obter informações detalhadas sobre como o Azure Monitor armazena dados, confira Plataforma de dados do Azure Monitor.
O HDInsight armazena seus arquivos de log no sistema de arquivos de cluster e no Armazenamento do Microsoft Azure. Devido ao grande número e tamanho dos arquivos de log, é importante otimizar o armazenamento e o arquivamento de logs para ajudar no gerenciamento de custos. Para obter mais informações, consulte Gerenciar logs para um cluster HDInsight.
Métricas de plataforma do Azure Monitor
O Azure Monitor fornece métricas de plataforma para a maioria dos serviços. Essas métricas são:
- Definidas individualmente para cada namespace.
- Armazenadas no banco de dados de métricas da série temporal do Azure Monitor.
- Leves e capazes de dar suporte a alertas quase em tempo real.
- Usadas para acompanhar o desempenho de um recurso ao longo do tempo.
Coleta: O Azure Monitor coleta as métricas da plataforma automaticamente. Nenhuma configuração é necessária.
Roteamento: Você também pode rotear algumas métricas da plataforma para Logs do Azure Monitor / Log Analytics para que você possa consultá-las com outros dados de log. Verifique a configuração de exportação de DS para cada métrica para ver se você pode usar uma configuração de diagnóstico para rotear a métrica para Logs do Azure Monitor / Log Analytics.
- Para obter mais informações, confira a Configuração de diagnóstico de métricas.
- Para definir as configurações de diagnóstico para um serviço, confira Criar configurações de diagnóstico no Azure Monitor.
Para obter uma lista de todas as métricas que é possível coletar para todos os recursos no Azure Monitor, confira Métricas com suporte no Azure Monitor.
Para obter uma lista de métricas coletadas automaticamente para HDInsight, confira a Referência de dados de monitoramento do HDInsight.
Logs de recursos do Azure Monitor
Os logs de recursos fornecem insights sobre as operações que foram executadas por um recurso do Azure. Os logs são gerados automaticamente, mas você precisa encaminhá-los para os logs do Azure Monitor para serem salvos ou consultados. Os logs são organizados em categorias. Um determinado namespace pode ter várias categorias de logs de recursos.
Coleta: Os logs de recursos não serão coletados nem armazenados enquanto você não criar uma configuração de diagnóstico e encaminhar os logs para um ou mais locais. Ao criar uma configuração de diagnóstico, você especifica quais categorias de logs coletar. Há várias maneiras de criar e manter configurações de diagnóstico, incluindo o portal do Azure, programaticamente e por meio do Azure Policy.
Encaminhamento: O padrão sugerido é encaminhar os logs de recursos para os logs do Azure Monitor para que você possa consultá-los com outros dados de logs. Também estão disponíveis outros locais, como o Armazenamento do Microsoft Azure, os Hubs de Eventos do Azure e determinados parceiros de monitoramento da Microsoft. Para obter mais informações, confira Logs de recursos do Azure e Destinos de logs de recursos.
Para obter informações detalhadas sobre como coletar, armazenar e encaminhar logs de recursos, confira Configurações de diagnóstico no Azure Monitor.
Para obter uma lista de todas as categorias de logs de recursos disponíveis no Azure Monitor, confira Logs de recursos com suporte no Azure Monitor.
Todos os logs de recursos no Azure Monitor têm os mesmos campos de cabeçalho, seguidos de campos específicos do serviço. O esquema comum está descrito em Esquema do log de recursos do Azure Monitor.
Logs coletados pelo agente
O HDInsight não produz logs de recursos pelo método usual. Em vez disso, ele coleta logs de dentro do cluster HDInsight e os envia para as tabelas do Log Analytics / Logs do Azure Monitor usando o Agente do Log Analytics.
Um cluster HDInsight produz muitos arquivos de log, como:
- Logs de execução de trabalho
- Arquivos do Resource Manager de log YARN
- Logs de ações de script
- Status dos alertas do cluster Ambari
- Métricas do sistema Ambari
- Logs de segurança
- Atividade do Hadoop registrada nos arquivos de log do controlador, stderr e syslog
Os logs específicos disponíveis dependem da estrutura e das ferramentas do cluster. Depois de habilitar a integração do Azure Monitor para seu cluster, você poderá exibir e consultar em qualquer um desses logs.
- Para obter mais informações sobre os logs coletados, confira Gerenciar logs para um cluster HDInsight.
- Para ver as tabelas e os esquemas de logs disponíveis do Log Analytics e do Azure Monitor para HDInsight, confira a referência de dados de monitoramento do HDInsight.
Registro em log seletivo
Os clusters HDInsight podem coletar muitos logs detalhados. Para ajudar a economizar nos custos de monitoramento e armazenamento, habilite o recurso de registro em log seletivo usando ações de script para HDInsight no portal do Azure. O log seletivo permite ativar e desativar diferentes logs e fontes de métrica disponíveis por meio do Log Analytics. Com esse recurso, você só precisará pagar pelo que usar.
Você pode configurar a coleta e a análise de logs para habilitar ou desabilitar tabelas no workspace do Log Analytics e ajustar o tipo de origem para cada tabela. Para obter instruções detalhadas, confira Usar o registro em log seletivo com uma ação de script no Azure HDInsight.
Log de atividades do Azure
O log de atividades contém eventos de nível de assinatura que acompanham as operações de cada recurso do Azure, conforme visto fora desse recurso, por exemplo, criar um recurso ou iniciar uma máquina virtual.
Coleta: Os eventos do log de Atividades são gerados e coletados automaticamente em um repositório separado para serem vistos no portal do Azure.
Roteamento: você pode enviar dados de log de atividades para os logs do Azure Monitor para analisá-los junto com outros dados de log. Também estão disponíveis outros locais, como o Armazenamento do Microsoft Azure, os Hubs de Eventos do Azure e determinados parceiros de monitoramento da Microsoft. Para obter mais informações sobre como encaminhar o log de atividades, confira Visão geral do log de atividades do Azure.
Analisar dados de monitoramento
Existem várias ferramentas para analisar os dados de monitoramento.
Ferramentas do Azure Monitor
O Azure Monitor dá suporte às seguintes ferramentas básicas:
Explorador de Métricas, uma ferramenta no portal do Azure que permite que você veja e analise as métricas de recursos do Azure. Para obter mais informações sobre essa ferramenta, consulte Analisar métricas com o explorador de métricas do Azure Monitor.
Log Analytics, uma ferramenta no portal do Azure que permite consultar e analisar dados de log usando o KQL (Linguagem de Consulta Kusto). Para obter mais informações, consulte Introdução às consultas de log no Azure Monitor.
O log de atividades, que tem uma interface do usuário no portal do Azure para exibição e pesquisas básicas. Para fazer uma análise mais detalhada, você precisa encaminhar os dados para os logs do Azure Monitor e executar consultas mais complexas no Log Analytics.
As ferramentas que permitem uma visualização mais complexa incluem:
- Painéis, que permitem que você combine diferentes tipos de dados em um único painel no portal do Azure.
- Pastas de Trabalho, relatórios personalizáveis que você pode criar no portal do Azure. As pastas de trabalho podem incluir texto, métricas e consultas de log.
- Grafana, uma ferramenta de plataforma aberta que oferece excelência em termos de painéis operacionais. Você pode usar o Grafana para criar painéis que incluem dados de várias fontes além do Azure Monitor.
- Power BI, um serviço de análises corporativas que fornece visualizações interativas nas diversas fontes de dados. Você pode configurar o Power BI para importar dados de log automaticamente do Azure Monitor a fim de aproveitar essas visualizações.
Os Logs do Azure Monitor coletam dados de seus recursos de cluster HDInsight e de outras ferramentas de monitoramento e usam os dados para fornecer análise em várias fontes.
Você deve configurar a integração do Azure Monitor para poder exibir e analisar logs de cluster diretamente do seu cluster. Para obter mais informações, confira Como monitorar a disponibilidade do cluster com logs do Azure Monitor no HDInsight.
Uma nova integração do Azure Monitor (versão prévia) para HDInsight está substituindo o Log Analytics. Para obter mais informações, confira o guia de migração do Log Analytics para clusters Azure HDInsight.
Para cenários básicos que usam logs do Azure Monitor para analisar as métricas do cluster HDInsight e criar alertas de eventos, confira Consultar os logs do Azure Monitor para monitorar os clusters HDInsight.
Para obter instruções detalhadas sobre como habilitar logs do Azure Monitor e adicionar uma solução de monitoramento para operações de cluster Hadoop, confira Usar os logs do Azure Monitor para monitorar os clusters HDInsight.
Ferramentas de exportação do Azure Monitor
Você pode obter dados do Azure Monitor em outras ferramentas usando os seguintes métodos:
Métricas: Use a API REST para métricas para extrair dados de métricas do banco de dados de métricas do Azure Monitor. A API dá suporte a expressões de filtros para refinar os dados recuperados. Para obter mais informações, confira Referência da API REST do Azure Monitor.
Logs: Use a API REST ou as bibliotecas de cliente associadas.
Outra opção é a exportação de dados do workspace.
Para começar a usar a API REST do Azure Monitor, confira o Passo a passo da API REST de monitoramento do Azure.
Consultas do Kusto
Analise os dados de monitoramento nos logs do Azure Monitor/no repositório do Log Analytics usando o KQL (Linguagem de Consulta Kusto).
Importante
Quando você seleciona Logs no menu do serviço no portal, o Log Analytics é aberto com o escopo da consulta definido para o serviço atual. Esse escopo significa que as consultas de log incluirão apenas dados desse tipo de recurso. Se você quiser executar uma consulta que inclua dados de outros serviços do Azure, selecione Logs no menu do Azure Monitor. Confira Escopo da consulta de log e intervalo de tempo no Log Analytics do Azure Monitor para obter detalhes.
Para obter uma lista de consultas comuns para qualquer serviço, confira a Interface de consultas do Log Analytics.
Depois de habilitar a integração do Azure Monitor, você poderá selecionar Logs (versão prévia) na navegação à esquerda da sua página do portal do HDInsight e, em seguida, selecionar a guia Consultas para ver consultas de exemplo do seu cluster. Por exemplo, a consulta a seguir lista todos os computadores conhecidos que não enviaram uma pulsação nas últimas cinco horas.
// Unavailable computers
Heartbeat
| summarize LastHeartbeat=max(TimeGenerated) by Computer
| where LastHeartbeat < ago(5h)
A consulta a seguir obtém as 10 principais consultas de uso intensivo de recursos, com base no consumo de CPU, nas últimas 24 horas.
// Top 10 resource intensive queries
LAQueryLogs
| top 10 by StatsCPUTimeMs desc nulls last
Importante
A nova integração do Azure Monitor implementa novas tabelas no workspace do Log Analytics. Para remover o máximo de ambiguidade possível, há menos esquemas e a formatação do esquema é mais bem organizada e mais fácil de entender.
A nova integração de monitoramento no portal do Azure usa as novas tabelas, mas você deve refazer as consultas e os dashboards mais antigos para usar as novas tabelas. Para obter os mapeamentos da tabela de log da integração clássica do Azure Monitor às novas tabelas, confira o Mapeamento da tabela de log.
Alertas
Os alertas do Azure Monitor o notificam proativamente quando condições específicas são encontradas em seus dados de monitoramento. Os alertas permitem que você identifique e resolva problemas no seu sistema antes que os clientes os percebam. Para saber mais, confira Alertas do Azure Monitor.
Existem muitas fontes de alertas comuns para os recursos do Azure. Para obter exemplos de alertas comuns para recursos do Azure, confira Amostra de consultas de alerta de logs. O site Alertas de Linha de Base do Azure Monitor (AMBA) fornece um método semiautomatizado de implementação de alertas, painéis e diretrizes importantes de métrica de plataforma. O site se aplica a um subconjunto de serviços do Azure em contínua expansão, incluindo todos os serviços que fazem parte da Zona de Destino do Azure (ALZ).
O esquema de alerta comum padroniza a consumo do Azure Monitor para notificações de alerta no Azure. Para obter mais informações, confira Esquema de alertas comuns.
Tipos de alertas
Você pode receber alertas sobre qualquer fonte de dados de log ou métrica na plataforma de dados do Azure Monitor. Existem muitos tipos diferentes de alertas dependendo dos serviços que você está monitorando e dos dados de monitoramento que você está coletando. Diferentes tipos de alertas têm diversos benefícios e desvantagens. Para obter mais informações, confira Escolha o tipo de alerta de monitoramento correto para você.
A lista a seguir descreve os tipos de alertas do Azure Monitor que você pode criar:
- Os Alertas de métricas avaliam as métricas de recursos a intervalos regulares. As métricas podem ser métricas de plataforma, métricas personalizadas, logs do Azure Monitor convertidos em métricas ou métricas do Application Insights. Os alertas de métrica também podem aplicar várias condições e limites dinâmicos.
- Os Alertas de logs permitem que os usuários usem uma consulta do Log Analytics para avaliar os logs de recursos com uma frequência predefinida.
- Os Alertas do log de atividades são disparados quando ocorre um novo evento de log de atividades que corresponda às condições definidas. Os alertas do Resource Health e da Integridade do Serviço são alertas do log de atividades que relatam a integridade do serviço e do recurso.
Alguns serviços do Azure também dão suporte a alertas de detecção inteligentes, alertas do Prometheus ou regras de alerta recomendadas.
No caso de alguns serviços, você pode monitorar em larga escala aplicando a mesma regra de alerta de métricas a vários recursos do mesmo tipo que existem na mesma região do Azure. Notificações individuais são enviadas para cada recurso monitorado. Para ver os serviços e as nuvens do Azure com suporte, confira Monitorar vários recursos com uma regra de alerta.
Regras de alerta do HDInsight
Depois de habilitar a integração do Azure Monitor, selecione Alertas na navegação à esquerda da sua página do portal do HDInsight e selecione Criar regra de alerta para configurar alertas. Você pode basear um alerta em qualquer consulta do Log Analytics ou usar sinais de métricas ou do log de atividades.
A tabela a seguir descreve algumas regras de alerta do HDInsight. Esses alertas são apenas exemplos. Você pode definir alertas para qualquer métrica, entrada de log ou entrada de log de atividades listada na Referência de dados de monitoramento do HDInsight.
Tipo de alerta | Condição | Descrição |
---|---|---|
Indicador | CPU pendente | Sempre que a CPU máxima pendente for maior ou menor que o limite dinâmico |
Log de atividades | Excluir cluster | Sempre que o Log de Atividades tiver um evento com Category='Administrative', Signal name='Delete Cluster (HDInsight Cluster)' |
Para obter um exemplo que mostra como criar um alerta, consulte Alertas do Azure Monitor.
Recomendações do Assistente
Para alguns serviços, se ocorrerem condições críticas ou alterações iminentes durante operações de recurso, um alerta será exibido na página de Visão geral do serviço no portal. Você pode encontrar mais informações e correções recomendadas para o alerta nas Recomendações do assistente em Monitoramento no menu à esquerda. Durante as operações normais, nenhuma recomendação do assistente será exibida.
Para obter mais informações sobre o Assistente do Azure, confira Visão geral do Assistente do Azure.
Conteúdo relacionado
- Confira Referência de dados de monitoramento do HDInsight para obter uma referência das métricas, logs e outros valores importantes criados para o HDInsight.
- Confira Como monitorar recursos do Azure com o Azure Monitor para obter detalhes gerais sobre o monitoramento de recursos do Azure.