Partilhar via


Monitorar um ambiente de nuvem

Você precisa da observabilidade do seu ambiente de nuvem para ajudar a garantir que suas cargas de trabalho funcionem sem problemas, seja você proprietário de uma empresa, proprietário de plataforma ou proprietário de aplicativo. Precisa de saber se:

  • As suas aplicações estão disponíveis e se tiverem um desempenho de acordo com as expectativas dos seus clientes.
  • Você tem quaisquer ameaças à segurança que exijam investigação.
  • Os seus custos de consumo estão dentro do intervalo esperado.

O monitoramento é o processo de coleta, análise e atuação em telemetria que indica a integridade de sua plataforma, recursos e aplicativos. Um ambiente de monitoramento eficaz inclui todo o seu patrimônio de nuvem, que pode incluir recursos em várias nuvens e ambientes locais.

A observabilidade é uma propriedade de um sistema que mede quão bem seus estados internos podem ser inferidos a partir de suas saídas externas. Você precisa implantar serviços e processos para monitorar seu ambiente de nuvem. E você precisa ter a capacidade de observar e entender o comportamento de seus serviços que são executados na nuvem.

Benefícios da monitorização

Invista em seu ambiente de monitoramento para obter os seguintes benefícios em vários aspetos da sua nuvem:

  • Disponibilidade e desempenho: monitore os recursos para ajudar a garantir que seus serviços e aplicativos na nuvem estejam disponíveis e tenham o desempenho esperado. Para identificar e responder a problemas antes que eles afetem os usuários, acompanhe as principais métricas e configure regras de alerta.

  • Otimização de custos: use o monitoramento para rastrear o uso de recursos e dimensioná-los de acordo com a demanda. Essa abordagem ajuda a evitar recursos provisionados e subutilizados, o que otimiza os custos. O monitoramento também pode identificar e alertá-lo sobre quaisquer derrapagens de custos ou picos inesperados de uso.

  • Conformidade: use o monitoramento para manter registros e registros de atividades, o que ajuda a garantir que os serviços de nuvem estejam em conformidade com as políticas e regulamentações. Os relatórios que usam esses dados podem ajudar com auditorias regulares e verificações de conformidade.

  • Segurança: implemente o monitoramento contínuo para ajudar a detetar ameaças e vulnerabilidades de segurança para que você possa agir imediatamente para proteger dados e recursos. Você também pode analisar os dados coletados para deteção e resposta a ameaças.

Plataformas de monitorização

Uma estratégia de monitoramento eficaz inclui todas as plataformas em seu ambiente de computação. Além do Azure, você pode ter recursos locais, multicloud e de borda. Cada recurso requer os mesmos níveis de monitorização. Siga a orientação do Cloud Adoption Framework para Azure e inclua o monitoramento em sua estratégia de operações unificadas. Nessa estratégia, a nuvem primária hospeda suas ferramentas de monitoramento e outras ferramentas de gerenciamento. As ferramentas de monitoramento monitoram todos os recursos em todas as plataformas.

Diagrama conceitual que mostra a estratégia de operações unificadas.

Tipos de monitorização

O monitoramento é uma disciplina multifacetada que requer uma combinação de ferramentas, processos e práticas. O quadro seguinte descreve os vários tipos de monitorização. Diferentes serviços e recursos podem fornecer diferentes combinações desses tipos de monitoramento. Mas um ambiente de monitoramento abrangente inclui todos esses tipos de monitoramento em cada uma das plataformas em seu ambiente de computação.

Tipo Description
Infraestrutura O monitoramento de infraestrutura inclui o desempenho e a disponibilidade de recursos de nuvem, como máquinas virtuais, recursos de armazenamento e redes. Esse tipo de monitoramento ajuda a garantir que a infraestrutura subjacente funcione de forma otimizada, o que ajuda a manter a disponibilidade e o desempenho dos aplicativos que dependem dela.
Monitoramento de desempenho de aplicativos (APM) O APM monitora o desempenho e a disponibilidade de aplicativos executados na nuvem. Ele rastreia métricas como tempos de resposta, taxas de erro e volumes de transações. O APM identifica gargalos de desempenho e ajuda a garantir que os aplicativos atendam às expectativas do usuário.
Base de Dados O monitoramento de banco de dados rastreia o desempenho, a disponibilidade e o consumo de recursos de bancos de dados em nuvem. As principais métricas incluem o desempenho da consulta, o uso do índice e o status do bloqueio.
Rede O monitoramento de rede rastreia o desempenho e a disponibilidade dos componentes de rede no ambiente de nuvem. As métricas incluem uso de largura de banda, latência e perda de pacotes.
Segurança O monitoramento de segurança rastreia e analisa eventos de segurança e vulnerabilidades no ambiente de nuvem, incluindo acesso não autorizado, malware e violações de conformidade. O monitoramento de segurança eficaz ajuda a proteger dados confidenciais, garantir a conformidade com os requisitos regulamentares e evitar violações de segurança dispendiosas.
Conformidade O monitoramento de conformidade ajuda a garantir que o ambiente de nuvem esteja de acordo com os padrões regulatórios e do setor. Ele rastreia configurações, controles de acesso e práticas de tratamento de dados para ajudar a garantir a conformidade com as regulamentações relevantes.
Custo O monitoramento de custos rastreia os gastos na nuvem e o uso de recursos para identificar oportunidades de economia de custos e evitar estouros de orçamento. Ele monitora o uso de recursos, identifica recursos subutilizados e otimiza as configurações de recursos para ajudar a reduzir custos.

Responsabilidade partilhada

Em um ambiente local, você é responsável por todos os aspetos do monitoramento porque possui e gerencia todos os recursos de computação. Na nuvem, você compartilha essa responsabilidade com seu provedor de nuvem. Dependendo do tipo de modelo de implantação escolhido, as responsabilidades pelo monitoramento de várias camadas da pilha de nuvem podem ser transferidas de você para seu provedor de nuvem.

Em uma implantação de infraestrutura como serviço (IaaS), o provedor de nuvem monitora a plataforma de nuvem subjacente, como a infraestrutura física e a camada de virtualização. Além disso, monitoriza o sistema operativo, as aplicações e os dados executados nas máquinas virtuais que implementa na plataforma na nuvem. Quando o modelo de implantação sobe na pilha, o provedor de nuvem assume mais responsabilidade para monitorar o ambiente. Essa responsabilidade culmina em uma implantação de software como serviço (SaaS) porque você transfere a responsabilidade de monitoramento para o provedor de nuvem para toda a pilha, incluindo o aplicativo e os dados.

Diagrama que mostra responsabilidades compartilhadas para monitoramento na nuvem.

Você pode usar ferramentas de monitoramento do provedor de nuvem para monitorar suas camadas da pilha, mas é responsável por configurar essas ferramentas e analisar os dados que elas coletam. Você precisa conceder acesso a vários membros da sua organização e criar painéis e alertas para ajudá-los a distinguir informações críticas. Você também pode precisar integrar esses componentes com outras ferramentas e sistemas de tíquete que sua organização usa.

O provedor de nuvem deve executar os mesmos tipos de serviço para suas camadas da pilha que você fornece aos seus clientes internos. Eles devem monitorar continuamente a saúde e o desempenho da plataforma que contratam para você. Eles fornecem painéis e alertas para notificá-lo proativamente sobre quaisquer problemas de serviço. Assim como seus clientes internos, você não precisa de visibilidade sobre as complexidades de como o provedor de nuvem monitora sua plataforma, apenas que eles atendam aos contratos de nível de serviço que você contrata com eles.

Funções e responsabilidades

A maioria das organizações empresariais tem uma equipe de operações centralizada que monitora a integridade geral e o desempenho do ambiente de nuvem.

Esta equipa normalmente:

  • Define as estratégias para a empresa como um todo.
  • Executa a configuração centralizada do ambiente de monitoramento.
  • Delega permissões às partes interessadas em sua organização que precisam de acesso aos dados de monitoramento relacionados a seus aplicativos e serviços.

As organizações têm várias funções que mantêm o ambiente de monitoramento e que exigem acesso aos dados de monitoramento para executar suas funções de trabalho. Cada função tem requisitos diferentes para monitorar dados com base em suas responsabilidades específicas. Dependendo do tamanho da sua organização, você pode ter vários indivíduos que preenchem cada função ou pode ter um indivíduo que preenche várias funções.

As organizações individuais podem distribuir as responsabilidades de forma diferente. A tabela a seguir mostra um exemplo das funções e responsabilidades de uma organização típica.

Função Description
Arquiteto de nuvem O arquiteto de nuvem projeta e supervisiona a infraestrutura de nuvem para ajudar a garantir que ela atenda às metas de negócios da organização. O arquiteto de nuvem se concentra na confiabilidade, segurança e escalabilidade da arquitetura de nuvem. Eles exigem telemetria de alto nível para obter uma visão holística do patrimônio digital. Essa telemetria inclui métricas de uso de recursos, métricas de APM, informações de custo e faturamento e relatórios de conformidade.
Engenheiro de plataforma O engenheiro de plataforma cria e gerencia a plataforma que os desenvolvedores usam para implantar seus aplicativos. O engenheiro de plataforma pode criar pipelines de integração contínua e entrega contínua (CI/CD), gerenciar a infraestrutura de nuvem como código (IaC) e garantir a escalabilidade e a confiabilidade da plataforma. O engenheiro de plataforma requer telemetria sobre o status operacional da plataforma. Essa telemetria inclui métricas de desempenho de contêiner, logs de orquestração, validação de IaC e disponibilidade de serviço.
Administrador de sistema O administrador do sistema gerencia e mantém servidores, sistemas operacionais e outros componentes de infraestrutura na nuvem. Eles executam backups, solucionam problemas e garantem que os sistemas estejam atualizados. O administrador do sistema requer telemetria no nível do servidor e do sistema operacional, incluindo uso de CPU, memória e disco, desempenho da rede e logs do sistema.
Engenheiro de segurança O engenheiro de segurança implementa e gerencia medidas de segurança para ajudar a proteger dados e aplicativos contra ameaças. O engenheiro de segurança lida com tudo, desde o gerenciamento de identidades até a deteção e resposta a ameaças. Eles usam telemetria sobre eventos de segurança, incluindo logs de acesso, alertas de deteção de ameaças, avaliações de vulnerabilidade e métricas de conformidade.
Administrador de rede O administrador de rede gerencia e mantém a rede de nuvem para ajudar a garantir que os dados fluam de forma segura e eficiente entre servidores, aplicativos e usuários. O administrador de rede lida com configurações de rede, monitora o desempenho e implementa medidas de segurança. Eles exigem telemetria centrada na rede, incluindo análise de tráfego de rede, medições de latência, perda de pacotes e logs de firewall.
Administrador de banco de dados (DBA) O DBA gerencia e mantém bancos de dados para ajudar a garantir a integridade, o desempenho e a disponibilidade dos dados. O DBA lida com backups e recuperação de banco de dados e otimiza consultas para eficiência. Eles usam telemetria sobre desempenho e integridade do banco de dados, incluindo métricas de desempenho de consulta, tempos de resposta do banco de dados, logs de transações e status de backup ou recuperação.
Programador O desenvolvedor projeta, escreve, testa e mantém o software que é executado em plataformas de nuvem. O desenvolvedor cria recursos e corrige bugs para ajudar a garantir que o aplicativo permaneça seguro e tenha um bom desempenho. Eles exigem telemetria específica do aplicativo, incluindo taxas de erro, latência, tempos de resposta, análise de comportamento do usuário e métricas de uso de recursos.

Facilitação do Azure

O Azure tem muitos serviços que suportam os diferentes tipos de monitorização de que necessita no seu ambiente de nuvem. Cada serviço tem como alvo uma ou mais funções. Combine serviços para fornecer os recursos necessários para um ambiente de monitoramento abrangente.

Serviço Description Type Funções
Azure Monitor O Azure Monitor está no centro do ecossistema de monitoramento do Azure. É uma solução de monitoramento abrangente que você pode usar para coletar, analisar e responder a dados de monitoramento de seus ambientes locais e na nuvem. O Azure Monitor fornece monitoramento completo de sua infraestrutura, rede e aplicativos. Ele também fornece uma plataforma de dados e recursos principais, como análise de dados, visualização e alertas para outros serviços. Infraestruturas,
base de dados,
conformidade
Arquiteto de nuvem,
engenheiro de plataformas,
administrador de sistemas,
DBA
Application Insights O Application Insights é um recurso do Azure Monitor que fornece monitoramento de APM para seus aplicativos na nuvem. APM Programador
Observador de Rede do Azure O Inspetor de Rede fornece recursos de monitoramento e visualização para recursos de rede no Azure. Use este serviço para monitorar, diagnosticar e visualizar métricas. Você também pode habilitar ou desabilitar logs para recursos em uma rede virtual do Azure. Rede Administrador de rede
Microsoft Sentinel O Microsoft Sentinel é uma solução de gerenciamento de eventos de segurança (SIEM) e de orquestração de segurança (SOAR) nativa da nuvem. Ele ingere a telemetria de segurança de seus recursos do Azure e outros componentes para fornecer deteção, investigação, resposta e caça proativa de ameaças cibernéticas. Segurança Engenheiro de segurança
Microsoft Defender XDR O Defender XDR inclui soluções de segurança da Microsoft nativas da plataforma Azure, sistemas operacionais Microsoft cliente e servidor e aplicativos, incluindo Office 365, Exchange Online e SharePoint no Microsoft 365. Cada solução de segurança usa IA e aprendizado de máquina para correlacionar a telemetria e determinar se as investigações são necessárias. Quando detetam comportamentos inaceitáveis, tomam medidas para evitar interrupções. Segurança Engenheiro de segurança
Gerenciamento de custos da Microsoft O Gerenciamento de Custos é um conjunto de ferramentas que você pode usar para analisar, monitorar e otimizar seus custos do Microsoft Cloud. O Gerenciamento de Custos está disponível para qualquer pessoa que tenha acesso a uma conta de cobrança, assinatura, grupo de recursos ou grupo de gerenciamento. Custo Arquiteto de nuvem
Azure Service Health A Integridade do Serviço fornece um status de integridade dos serviços nos quais seus recursos do Azure dependem. Ele pode informá-lo sobre quaisquer interrupções de serviço e fornecer uma exibição personalizada da integridade de seus serviços e regiões do Azure. Infraestrutura Fornecedor de serviços cloud