Observabilidade do Nexus do Operador do Azure
A estrutura de observabilidade do Nexus do Operador fornece insights operacionais sobre suas instâncias locais. A estrutura dá suporte a LMA (registro, monitoramento e alertas), análise e visualização de dados e métricas operacionais (plataforma e cargas de trabalho).
Imagem: Estrutura LMA (registro, monitoramento e alertas) do Nexus do Operador
Os principais destaques da estrutura de observabilidade do Nexus do Operador são:
- Coleta de dados centralizada: a solução de observabilidade do Nexus do Operador baseia-se em uma coleção de todos os dados em um local central. Nesse local, você pode observar os dados de monitoramento de todas as instâncias locais.
- Ferramentas bem definidas e testadas: a solução depende do Azure Monitor que coleta, analisa e atua em dados de telemetria de suas instâncias locais e ne nuvem.
- Fácil de aprender e usar: a solução facilita a análise e a depuração de problemas com a capacidade de pesquisar os dados de dentro ou de todas as instâncias locais e ne nuvem.
- Ferramentas de visualização: você cria dashboards e pastas de trabalho personalizados de acordo com suas necessidades.
- Ferramentas de alerta integradas: você cria alertas com base em limites personalizados. Você pode criar e reutilizar modelos de alerta em todas as instâncias.
Este artigo ajuda você a entender a estrutura de observabilidade do Nexus do Operador que consiste em uma pilha de componentes:
- O Azure Monitor coleta e agrega dados de log dos componentes do Nexus do Operador
- O LAW (Workspace do Azure Log Analytics) coleta e agrega dados de log de várias assinaturas e locatários do Azure
- A análise, visualização e alertas são executados nos dados de log agregados.
Monitoramento da plataforma
O Nexus do Operador oferece visibilidade sobre o desempenho de suas implantações que consistem em recursos de infraestrutura. Você precisa que os logs e as métricas sejam coletados e analisados nesses recursos da plataforma. Você obtém insights valiosos da coleção centralizada e da agregação de dados de todas as fontes, em comparação com os dados não agregados.
Esses logs e métricas são usados para observar o estado da plataforma. Você pode ver o desempenho e analisar o que está errado. Você pode analisar o que causou a situação. A visualização ajuda você a configurar os alertas necessários e em quais condições. Por exemplo, você pode configurar os alertas a serem gerados quando os recursos estiverem se comportando de forma anormal ou quando os limites forem atingidos. Você pode usar os logs e análises coletados para depurar os problemas que aparecerem no ambiente.
Dados de monitoramento
A observabilidade do Nexus do Operador permite que você colete o mesmo tipo de dados que outros recursos do Azure. Os dados coletados de cada uma de suas instâncias podem ser exibidos em seu LAW.
Aprenda sobre o monitoramento dos recursos do Azure aqui.
Coleta e roteamento
A observabilidade do Nexus do Operador permite que você colete dados para cada recurso de infraestrutura. O conjunto de componentes de infraestrutura inclui:
- Malha de rede que inclui CEs, TORs, NPBs, comutadores de gerenciamento e o servidor de terminal.
- Computação que inclui servidores de computador bare-metal.
- Painel de controle undercloud (cluster do Kubernetes responsável pela implantação e gerenciamento do ciclo de vida de toda a plataforma).
A coleção de dados de log dessas camadas é habilitada por padrão durante a criação da instância do Nexus do Operador. Esses logs coletados são roteados para o LAW do Azure Monitor.
Você também pode coletar dados das camadas de locatário criadas para executar funções virtualizadas de rede e conteinerizadas. Os dados do log que podem ser coletados incluem:
- Coleção de syslog de máquinas virtuais (usada para cargas de trabalho VNFs ou CNF).
- Coleção de logs dos clusters do Kubernetes e os aplicativos implantados neles.
Você precisará habilitar a coleção de logs dos clusters do Kubernetes do locatário e das máquinas virtuais. Você deve seguir as etapas para implantar os agentes de monitoramento do Azure. Os dados seriam coletados em seu LAW do Azure.
Armazenamento de logs do Nexus do Operador
Os dados em Logs do Azure Monitor são armazenados em tabelas em que cada tabela tem o próprio conjunto de propriedades exclusivas.
Todos os logs de recursos no Azure Monitor têm os mesmos campos seguidos por campos específicos do serviço; confira o esquema comum.
Os logs da plataforma do Nexus do Operador são armazenados nas seguintes tabelas:
Tabela | Descrição |
---|---|
syslog | Eventos do syslog em computadores Linux que usam o agente do Log Analytics |
ContainerInventory | Detalhes e estado atual de cada contêiner. |
ContainerLog | Linhas de log coletadas de fluxos stdout e stderr para contêineres |
ContainerNodeInventory | Detalhes de nós que servem como hosts de contêiner. |
InsightMetrics | Métricas coletadas do servidor, K8s, contêineres. |
KubeEvents | Eventos do Kubernetes e suas propriedades. |
KubeMonAgentEvents | Eventos registrados pelo agente do Kubernetes do Azure Monitor para obter erros e avisos. |
KubeNodeInventory | Detalhes dos nós que fazem parte do cluster do Kubernetes |
KubePodInventory | Pods do Kubernetes e suas propriedades |
KubePVInventory | Volumes persistentes do Kubernetes e suas propriedades. |
KubeServices | Serviços do Kubernetes e suas propriedades |
Pulsação | Registros guardados por agentes do Log Analytics uma vez por minuto para relatar a integridade do agente |
Métricas do Nexus do Operador
A tabela ''InsightMetrics'' na seção Logs contém as métricas coletadas de Computadores bare-metal e do cluster do Kubernetes undercloud. Além disso, algumas métricas selecionadas coletadas do undercloud podem ser observadas abrindo a guia Métricas no menu do Azure Monitor.
Figura: Seleção de Métricas do Azure Monitor
Consulte Análise de métricas com o explorador de métricas do Azure Monitor para obter detalhes sobre como usar essa ferramenta.
Pastas de trabalho
As pastas de trabalho combinam texto, consultas de log, métricas e parâmetros para análise de dados e criação de vários tipos de visualizações avançadas. Você pode usar os modelos de pasta de trabalho do Azure Resource Manager de exemplo para Registro e monitoramento do Nexus do Operador para implantar pastas de trabalho do Azure em seu LAW do Azure.
Alertas
Você pode usar os modelos de alarme do Azure Resource Manager de exemplo para regras de alerta do Nexus do Operador. Você deve especificar os limites e condições dos alertas. Em seguida, você pode implantar esses modelos de alerta em seu ambiente local.
Workspace do Log Analytic
Um LAW (Workspace do Log Analytics) é um ambiente exclusivo para registrar dados do Azure Monitor e de outros serviços do Azure. Cada workspace tem seu próprio repositório de dados e configuração, mas pode combinar dados de vários serviços. Cada workspace consiste em várias tabelas de dados.
Um LAW exclusivo pode ser criado para coletar todos os dados relevantes ou vários workspaces com base nos requisitos do operador.