Monitorar um ambiente de nuvem
Você precisa de observabilidade do seu ambiente de nuvem para ajudar a garantir que suas cargas de trabalho sejam executadas sem problemas, seja você proprietário de uma empresa, proprietário de plataforma ou proprietário de aplicativo. Você precisa saber se:
- Seus aplicativos estão disponíveis e se eles atendem às expectativas de seus clientes.
- Você tem ameaças à segurança que exijam investigação.
- Seus custos de consumo estão dentro da faixa esperada.
O monitoramento é o processo de coletar, analisar e agir com base na telemetria que indica a integridade de sua plataforma, recursos e aplicativos. Um ambiente de monitoramento eficaz inclui toda a sua propriedade de nuvem, que pode incluir recursos em várias nuvens e ambientes locais.
A observabilidade é uma propriedade de um sistema que mede o quão bem seus estados internos podem ser inferidos a partir de suas saídas externas. Você precisa implantar serviços e processos para monitorar seu ambiente de nuvem. E você precisa ter a capacidade de observar e entender o comportamento de seus serviços executados na nuvem.
Benefícios do monitoramento
Invista em seu ambiente de monitoramento para obter os seguintes benefícios em vários aspectos de sua nuvem:
Disponibilidade e desempenho: monitore os recursos para ajudar a garantir que seus serviços e aplicativos de nuvem estejam disponíveis e funcionem conforme o esperado. Para identificar e responder a problemas antes que eles afetem os usuários, acompanhe as principais métricas e configure regras de alerta.
Otimização de custos: use o monitoramento para rastrear o uso de recursos e dimensionar os recursos de acordo com a demanda. Essa abordagem ajuda a evitar recursos superprovisionados e subutilizados, o que otimiza o custo. O monitoramento também pode identificar e alertá-lo sobre estouros de custos ou picos inesperados de uso.
Conformidade: use o monitoramento para manter logs e registros de atividades, o que ajuda a garantir que os serviços em nuvem estejam em conformidade com as políticas e regulamentos. Os relatórios que usam esses dados podem ajudar com auditorias regulares e verificações de conformidade.
Segurança: implemente o monitoramento contínuo para ajudar a detectar ameaças e vulnerabilidades de segurança para que você possa agir imediatamente para proteger dados e recursos. Você também pode analisar os dados coletados para detecção e resposta a ameaças.
Plataformas de monitoramento
Uma estratégia de monitoramento eficaz inclui todas as plataformas em seu ambiente de computação. Além do Azure, você pode ter recursos locais, multinuvem e de borda. Cada recurso requer os mesmos níveis de monitoramento. Siga as diretrizes do Cloud Adoption Framework para Azure e inclua o monitoramento em sua estratégia de operações unificadas. Nessa estratégia, a nuvem primária hospeda suas ferramentas de monitoramento e outras ferramentas de gerenciamento. As ferramentas de monitoramento monitoram todos os recursos em todas as plataformas.
Tipos de monitoramento
O monitoramento é uma disciplina multifacetada que requer uma combinação de ferramentas, processos e práticas. A tabela a seguir detalha vários tipos de monitoramento. Diferentes serviços e recursos podem fornecer diferentes combinações desses tipos de monitoramento. Mas um ambiente de monitoramento abrangente inclui todos esses tipos de monitoramento em cada uma das plataformas em seu ambiente de computação.
Tipo | Descrição |
---|---|
Infraestrutura | O monitoramento de infraestrutura inclui o desempenho e a disponibilidade de recursos de nuvem, como máquinas virtuais, recursos de armazenamento e redes. Esse tipo de monitoramento ajuda a garantir que a infraestrutura subjacente funcione de maneira ideal, o que ajuda a manter a disponibilidade e o desempenho dos aplicativos que dependem dela. |
Monitoramento de desempenho de aplicativos (APM) | O APM monitora o desempenho e a disponibilidade dos aplicativos executados na nuvem. Ele rastreia métricas como tempos de resposta, taxas de erro e volumes de transações. O APM identifica gargalos de desempenho e ajuda a garantir que os aplicativos atendam às expectativas do usuário. |
Backup de banco de dados | O monitoramento de banco de dados rastreia o desempenho, a disponibilidade e o consumo de recursos dos bancos de dados em nuvem. As principais métricas incluem desempenho de consulta, uso de índice e status de bloqueio. |
Rede | O monitoramento de rede rastreia o desempenho e a disponibilidade dos componentes de rede no ambiente de nuvem. As métricas incluem uso de largura de banda, latência e perda de pacotes. |
Segurança | O monitoramento de segurança rastreia e analisa eventos de segurança e vulnerabilidades no ambiente de nuvem, incluindo acesso não autorizado, malware e violações de conformidade. O monitoramento de segurança eficaz ajuda a proteger dados confidenciais, garantir a conformidade com os requisitos regulatórios e evitar violações de segurança dispendiosas. |
Conformidade | O monitoramento de conformidade ajuda a garantir que o ambiente de nuvem esteja em conformidade com os padrões regulatórios e do setor. Ele rastreia configurações, controles de acesso e práticas de tratamento de dados para ajudar a garantir a conformidade com os regulamentos relevantes. |
Custo | O monitoramento de custos rastreia os gastos com a nuvem e o uso de recursos para identificar oportunidades de economia de custos e evitar estouros de orçamento. Ele monitora o uso de recursos, identifica recursos subutilizados e otimiza as configurações de recursos para ajudar a reduzir custos. |
Responsabilidades compartilhadas
Em um ambiente local, você é responsável por todos os aspectos do monitoramento porque possui e gerencia todos os recursos de computação. Na nuvem, você compartilha essa responsabilidade com seu provedor de nuvem. Dependendo do tipo de modelo de implementação escolhido, as responsabilidades de monitorar várias camadas da pilha de nuvem podem ser transferidas de você para seu provedor de nuvem.
Em uma implantação de infraestrutura como serviço (IaaS), o provedor de nuvem monitora a plataforma de nuvem subjacente, como a infraestrutura física e a camada de virtualização. E você monitora o sistema operacional, os aplicativos e os dados executados nas máquinas virtuais implantadas na plataforma de nuvem. Quando o modelo de implantação sobe na pilha, o provedor de nuvem assume mais responsabilidade para monitorar o ambiente. Essa responsabilidade culmina em uma implantação de software como serviço (SaaS) porque você transfere a responsabilidade de monitoramento para o provedor de nuvem para toda a pilha, incluindo o aplicativo e os dados.
Você pode usar ferramentas de monitoramento do provedor de nuvem para monitorar suas camadas da pilha, mas é responsável por configurar essas ferramentas e analisar os dados que elas coletam. Você precisa conceder acesso a vários membros da sua organização e criar painéis e alertas para ajudá-los a distinguir informações críticas. Você também pode precisar integrar esses componentes a outras ferramentas e sistemas de tíquetes que sua organização usa.
O provedor de nuvem deve executar os mesmos tipos de serviço para suas camadas da pilha que você fornece aos seus clientes internos. Eles devem monitorar continuamente a integridade e o desempenho da plataforma que contratam para você. Eles fornecem painéis e alertas para notificá-lo proativamente sobre quaisquer problemas de serviço. Assim como seus clientes internos, você não precisa de visibilidade das complexidades de como o provedor de nuvem monitora sua plataforma, apenas que eles atendam aos acordos de nível de serviço que você contrata com eles.
Funções e responsabilidades
A maioria das organizações corporativas tem uma equipe de operações centralizada que monitora a integridade geral e o desempenho do ambiente de nuvem.
Esta equipe normalmente:
- Define as estratégias para a empresa como um todo.
- Executa a configuração centralizada do ambiente de monitoramento.
- Delega permissões aos participantes em sua organização que exigem acesso aos dados de monitoramento relacionados a seus aplicativos e serviços.
As organizações têm várias funções que mantêm o ambiente de monitoramento e que exigem acesso aos dados de monitoramento para executar suas funções de trabalho. Cada função tem requisitos diferentes para monitorar dados com base em suas responsabilidades específicas. Dependendo do tamanho da sua organização, você pode ter várias pessoas que preenchem cada função ou pode ter uma pessoa que preenche várias funções.
Organizações individuais podem distribuir responsabilidades de maneira diferente. A tabela a seguir mostra um exemplo das funções e responsabilidades de uma organização típica.
Função | Descrição |
---|---|
Arquiteto de nuvem | O arquiteto de nuvem projeta e supervisiona a infraestrutura de nuvem para ajudar a garantir que ela atenda às metas de negócios da organização. O arquiteto de nuvem se concentra na confiabilidade, segurança e escalabilidade da arquitetura de nuvem. Eles exigem telemetria de alto nível para obter uma visão holística da propriedade digital. Essa telemetria inclui métricas de uso de recursos, métricas de APM, insights de custo e cobrança e relatórios de conformidade. |
Engenheiro de plataforma | O engenheiro de plataforma cria e gerencia a plataforma que os desenvolvedores usam para implantar seus aplicativos. O engenheiro de plataforma pode criar pipelines de CI/CD (integração contínua e entrega contínua), gerenciar a infraestrutura de nuvem como código (IaC) e garantir a escalabilidade e a confiabilidade da plataforma. O engenheiro de plataforma requer telemetria sobre o status operacional da plataforma. Essa telemetria inclui métricas de desempenho de contêiner, logs de orquestração, validação de IaC e disponibilidade de serviço. |
Administrador do sistema | O administrador do sistema gerencia e mantém servidores, sistemas operacionais e outros componentes de infraestrutura na nuvem. Eles realizam backups, solucionam problemas e garantem que os sistemas estejam atualizados. O administrador do sistema requer telemetria no nível do servidor e do sistema operacional, incluindo uso de CPU, memória e disco, desempenho de rede e logs do sistema. |
Engenheiro de segurança | O engenheiro de segurança implementa e gerencia medidas de segurança para ajudar a proteger dados e aplicativos contra ameaças. O engenheiro de segurança lida com tudo, desde o gerenciamento de identidade até a detecção e resposta a ameaças. Eles usam telemetria sobre eventos de segurança, incluindo logs de acesso, alertas de detecção de ameaças, avaliações de vulnerabilidade e métricas de conformidade. |
Administrador de rede | O administrador de rede gerencia e mantém a rede em nuvem para ajudar a garantir que os dados fluam com segurança e eficiência entre servidores, aplicativos e usuários. O administrador de rede lida com configurações de rede, monitora o desempenho e implementa medidas de segurança. Eles exigem telemetria centrada na rede, incluindo análise de tráfego de rede, medições de latência, perda de pacotes e logs de firewall. |
Administrador de banco de dados (DBA) | O DBA gerencia e mantém bancos de dados para ajudar a garantir a integridade, o desempenho e a disponibilidade dos dados. O DBA lida com backups e recuperação de banco de dados e otimiza as consultas para eficiência. Eles usam telemetria sobre desempenho e integridade do banco de dados, incluindo métricas de desempenho de consulta, tempos de resposta do banco de dados, logs de transações e status de backup ou recuperação. |
Developer | O desenvolvedor projeta, escreve, testa e mantém o software executado em plataformas de nuvem. O desenvolvedor cria recursos e corrige bugs para ajudar a garantir que o aplicativo permaneça seguro e tenha um bom desempenho. Eles exigem telemetria específica do aplicativo, incluindo taxas de erro, latência, tempos de resposta, análise de comportamento do usuário e métricas de uso de recursos. |
Facilitação do Azure
O Azure tem muitos serviços que dão suporte aos diferentes tipos de monitoramento necessários em seu ambiente de nuvem. Cada serviço tem como destino uma ou mais funções. Combine serviços para fornecer os recursos necessários para um ambiente de monitoramento abrangente.
Serviço | Descrição | Type | Funções |
---|---|---|---|
Azure Monitor | O Azure Monitor está no centro do ecossistema de monitoramento do Azure. É uma solução de monitoramento abrangente que você pode usar para coletar, analisar e responder a dados de monitoramento de seus ambientes de nuvem e locais. O Azure Monitor fornece monitoramento completo de sua infraestrutura, rede e aplicativos. Ele também fornece uma plataforma de dados e recursos principais, como análise de dados, visualização e alertas para outros serviços. | Infra-estrutura base de dados compliance |
Arquiteto de nuvem, Engenheiro de Plataforma, administrador do sistema, DBA |
Application Insights | O Application Insights é um recurso do Azure Monitor que fornece monitoramento de APM para seus aplicativos de nuvem. | Provedores | Developer |
Observador de Rede do Azure | O Observador de Rede fornece recursos de monitoramento e visualização para recursos de rede no Azure. Use esse serviço para monitorar, diagnosticar e visualizar métricas. Você também pode habilitar ou desabilitar logs para recursos em uma rede virtual do Azure. | Rede | Administrador de rede |
Microsoft Sentinel | O Microsoft Sentinel é uma solução nativa de nuvem de SIEM (gerenciamento de eventos de informações de segurança) e SOAR (resposta automatizada de orquestração de segurança). Ele ingere a telemetria de segurança de seus recursos do Azure e outros componentes para fornecer detecção, investigação, resposta e busca proativa de ameaças cibernéticas. | Segurança | Engenheiro de segurança |
Microsoft Defender XDR | O Defender XDR inclui soluções de segurança da Microsoft nativas da plataforma Azure, sistemas operacionais cliente e servidor da Microsoft e aplicativos, incluindo Office 365, Exchange Online e SharePoint no Microsoft 365. Cada solução de segurança usa IA e aprendizado de máquina para correlacionar a telemetria e determinar se as investigações são necessárias. Quando detectam um comportamento inaceitável, eles tomam medidas para evitar interrupções. | Segurança | Engenheiro de segurança |
Gerenciamento de Custos da Microsoft | O Gerenciamento de Custos é um conjunto de ferramentas que você pode usar para analisar, monitorar e otimizar seus custos do Microsoft Cloud. O Gerenciamento de Custos está disponível para qualquer pessoa que tenha acesso a uma conta de cobrança, assinatura, grupo de recursos ou grupo de gerenciamento. | Custo | Arquiteto de nuvem |
Integridade do Serviço do Azure | A Integridade do Serviço fornece um status de integridade dos serviços dos quais seus recursos do Azure dependem. Ele pode informá-lo sobre quaisquer interrupções de serviço e fornecer uma exibição personalizada da integridade de seus serviços e regiões do Azure. | Infraestrutura | Provedor de nuvem |