Preparar suas operações de nuvem do Azure
Este artigo ajuda você a estabelecer e manter operações efetivas para gerenciar sua propriedade de nuvem do Azure. As operações de nuvem bem-sucedidas exigem responsabilidades e processos claramente definidos para cada área de gerenciamento de nuvem.
Identificar suas responsabilidades de gerenciamento
Gerenciar efetivamente seu ambiente do Azure envolve responsabilidades centrais (em toda a plataforma) e responsabilidades de carga de trabalho. As responsabilidades centrais dão suporte a toda a sua propriedade de nuvem do Azure. As responsabilidades de carga de trabalho se concentram em uma carga de trabalho individual. Use Tabela 1 para garantir que suas operações contemplem responsabilidades essenciais das operações de nuvem.
Tabela 1. Principais responsabilidades de gerenciamento de nuvem
Áreas de gerenciamento de nuvem | Responsabilidades centrais | Responsabilidades de carga de trabalho |
---|---|---|
Conformidade | ▪ Defina procedimentos operacionais. ▪ Impor políticas de governança. ▪ Monitore a conformidade e corrija ou escalone conforme necessário. |
▪ Siga os procedimentos operacionais. ▪ Alinhar o design com políticas de governança. |
Segurança | ▪ Gerenciar operações de segurança em toda a organização. ▪ Gerenciar identidades no Microsoft Entra ID. ▪ Conceda acesso a assinaturas do Azure. ▪ Defina e mantenha linhas de base de segurança por meio do Azure Policy e do Microsoft Defender para Nuvem. ▪ Supervisionar a proteção contra ameaças e a integração de resposta a incidentes com o Microsoft Sentinel. |
▪ Implementar o design seguro da carga de trabalho. ▪ Responda a alertas e incidentes de segurança específicos da carga de trabalho. ▪ Avalie continuamente as vulnerabilidades dentro da carga de trabalho. |
Gestão de recursos | ▪ Definir e manter a hierarquia de recursos. ▪ Crie assinaturas da carga de trabalho conforme solicitado. ▪ Defina a estratégia de nomenclatura e marcação. ▪ Definir topologia de rede. ▪ Configurar a rede compartilhada (emparelhamento de rede virtual, conectividade local). ▪ Gerenciar a carga de trabalho cruzada ou recursos/serviços compartilhados. ▪ Monitore os limites de assinatura e manipule solicitações de aumentos de cota. |
▪ Gerenciar assinaturas específicas da carga de trabalho (se delegado). ▪ Gerenciar grupos de recursos e recursos para cada carga de trabalho. ▪ Siga e aplique os padrões de nomenclatura e marcação. ▪ Gerencie a utilização de recursos no nível do aplicativo, garantindo que os recursos permaneçam dentro das cotas de assinatura. |
Implantação | ▪ Padronizar e controlar pipelines e ferramentas de CI/CD (Azure DevOps, GitHub Actions). ▪ Defina modelos de infraestrutura como código de referência (modelos Bicep, Terraform, ARM). ▪ Forneça práticas recomendadas centrais para segurança de pipeline (verificação de código, gerenciamento de segredos). |
▪ Use a estrutura central de CI/CD e modelos de IaC nas implantações de carga de trabalho. ▪ Implementar tarefas de implantação específicas da carga de trabalho (definir configurações de aplicativo, banco de dados). ▪ Adapte modelos de referência às necessidades de carga de trabalho respeitando as diretrizes centrais. |
Desenvolvimento | ▪ Forneça e imponha cadeias de ferramentas de desenvolvimento padronizadas e estruturas para acelerar a consistência (padrões de codificação, práticas recomendadas do DevOps). ▪ Mantenha repositórios internos ou feeds de pacotes para bibliotecas ou módulos compartilhados. |
▪ Adote e adapte as cadeias de ferramentas padrão para o desenvolvimento de carga de trabalho. ▪ Possua o ciclo de vida do aplicativo e incorpore as melhores práticas (teste de unidade, teste de integração). ▪ Gerencie a melhoria contínua na base de código da carga de trabalho. |
Monitorização | ▪ Planejar a estratégia de monitoramento. ▪ Alerta sobre responsabilidades centralizadas. ▪ Forneça painéis para métricas operacionais comuns em todo o ambiente. |
▪ Monitorar carga de trabalho ▪ Estenda ou ajuste alertas centrais para capturar condições específicas da carga de trabalho. ▪ Investigue e corrija incidentes no nível da carga de trabalho com base em alertas e logs. |
Custo | ▪ Alocar orçamentos de nuvem globais ou de nível de assinatura ▪ Monitore os gastos em nuvem em toda a organização e crie relatórios de custo. ▪ Aloque custos para unidades de negócios ou produtos, normalmente usando marcas ou modelos de alocação de custos personalizados. ▪ Aplicar a estratégia de tagueamento para distribuição de custos. |
▪ Design de carga de trabalho para otimização de custos ▪ Respeitar restrições orçamentárias. |
Fiabilidade | ▪ Defina os requisitos de confiabilidade (SLO, RPO, RTO) por prioridade de carga de trabalho. ▪ Forneça diretrizes sobre bcdr (continuidade dos negócios e recuperação de desastre). ▪ Gerenciar soluções centralizadas de recuperação de desastre . ▪ Dê suporte ao gerenciamento de incidentes principal em todas as cargas de trabalho. |
▪ Projete a carga de trabalho para atender aos requisitos de confiabilidade. |
Desempenho | ▪ Monitore e mantenha o desempenho em componentes centralizados (rede hub, serviços compartilhados). ▪ Forneça diretrizes para otimização de desempenho e planejamento de capacidade. ▪ Monitore o limite |
▪ Projetar carga de trabalho para eficiência de desempenho. |
Estabelecer suas operações de nuvem
Use as responsabilidades descritas na Tabela 1 para criar uma base operacional eficaz. Defina claramente equipes, padrões e processos seguindo estas etapas:
Defina seu modelo de operações de nuvem. Escolha um modelo de gerenciamento centralizado ou compartilhado com base no tamanho e na maturidade da sua organização, descritos na tabela a seguir:
Abordagem de operações Responsabilidades e escopo Mais adequado para Profissionais Contras Centralizado Uma única equipe gerencia todas as tarefas. Inicializações ou volume de memória de nuvem pequeno. Simplifica o gerenciamento de nuvem. Corre o risco de criar gargalos. Gerenciamento compartilhado Equipes centrais (plataforma) e de carga de trabalho separadas Organizações com cargas de trabalho diversas. Equilibra a governança e a agilidade. Requer atribuição clara de responsabilidade Estabelecer responsabilidades centrais. Forme uma equipe dedicada para lidar com tarefas de gerenciamento central. Desenvolva uma matriz de habilidades da Tabela 1 para identificar a experiência necessária.
Estabeleça responsabilidades de carga de trabalho. Configure equipes especializadas para tarefas específicas da carga de trabalho. Identifique as responsabilidades usando a Tabela 1 e, em seguida, recrute adequadamente.
Realize uma revisão de Well-Architected do Azure. Use a ferramenta de avaliação deWell-Architected para reavaliar cada workload ao desenvolver e testar alterações de design.
Use o Azure Well-Architected Framework. Use o pilar de excelência operacional para orientar suas responsabilidades de gerenciamento de carga de trabalho.
Atribuir responsabilidade. Nomeie proprietários específicos para todas as responsabilidades de gerenciamento de nuvem. Em um modelo de gerenciamento compartilhado, as equipes de carga de trabalho devem ter autonomia para gerenciar suas assinaturas.
Documentar suas operações de nuvem
Documente claramente suas operações de nuvem para habilitar a resposta de crise eficiente e a implementação suave de alterações. Estabeleça procedimentos abrangentes e crie guias detalhados para tarefas frequentes e específicas.
Documentar procedimentos operacionais
Defina procedimentos operacionais para gerenciar alterações, recuperação de desastres e tarefas de manutenção de rotina que a automação não pode lidar. Siga estas etapas:
Definir procedimentos de gerenciamento de alterações. A alteração é a principal causa de falha na nuvem. Desenvolva um processo padronizado para gerenciar alterações para evitar falhas em seu ambiente de nuvem. Consulte Gerenciar alteração.
Definir procedimentos de implantação (gerenciamento de versão). Para manter a configuração consistente, padronizar suas implantações, versões e promoções de ambiente. Consulte Gerenciar implantações.
Defina procedimentos de recuperação de desastre e continuidade de negócios. Para lidar com possíveis falhas, prepare um plano de resposta padronizado. Consulte Gerenciar a recuperação de desastres e a continuidade dos negócios.
Defina procedimentos adicionais. Processos de documento para gerenciar solicitações de serviço, aplicação de patch e gerenciamento de configuração. Documente claramente esses processos para garantir que os stakeholders saibam como iniciar ou concluir cada tarefa.
Documentar as guias operacionais
Crie guias passo a passo detalhados (runbooks ou guias estratégicos) para as principais tarefas operacionais. Essa preparação garante a execução consistente, melhora a eficiência e reduz os tempos de resolução durante eventos críticos.
Defina tarefas diárias. Prepare manuais que abrangem responsabilidades diárias, como solicitações de escalonamento de privilégios e revisões de log. Estabeleça Procedimentos Operacionais Padrão (SOPs) para monitorar métricas, limites de alerta e painéis para cada sistema.
Crie uma biblioteca de runbooks centrados no Azure. Crie runbooks específicos do Azure abordando cenários como:
Cenário Exemplo Alto uso da CPU Serviço de Aplicativos do Azure Failover e failback Azure Site Recovery Implantações azul/verde Azure Front Door Restauração de backup Armazenamento de Blobs do Azure e Azure Cosmos DB Armazene esses runbooks em um repositório central. Mantenha os runbooks em um repositório central acessível pelos engenheiros de chamada para uso imediato durante incidentes.
Implementar operações programaticamente. Integre a infraestrutura como código em seus runbooks para implantar recursos comuns de forma consistente e precisa a cada vez.
Examine e atualize. Examine e revise periodicamente a documentação para refletir os ajustes operacionais e as atualizações do serviço de nuvem.
Ferramentas e soluções de documentos
Adote ferramentas e processos padronizados para operações de nuvem em toda a sua organização. Verifique se as equipes usam o Azure Monitor, o sistema de tíquetes, os modelos de IaC (infraestrutura como código) e os pipelines de implantação (GitHub Actions ou Azure Pipelines). Essa abordagem promove a consistência, reduz a redundância e aprimora os recursos de suporte entre equipes.
Área | Benefícios de exemplo |
---|---|
Integração | A padronização simplifica as integrações consolidando logs e repositórios de código. |
Automação | Reutilize modelos de IaC entre equipes, scripts de automação e práticas recomendadas em projetos. |
Gerenciamento de incidentes | Capture problemas e gere ações de correção que se integram aos ciclos de versão. |
Gerenciar suas operações de nuvem
Padronizar ferramentas, automatizar tarefas rotineiras e alinhar a cobertura de suporte para simplificar as operações diárias de nuvem. Os processos claros minimizam a confusão e aceleram a resolução de incidentes. Verifique se as equipes adotam práticas unificadas de monitoramento, tíquete e infraestrutura como código. Siga estas diretrizes operacionais:
Gerenciar suporte à nuvem
Forneça suporte contínuo para incidentes críticos estabelecendo a cobertura 24/7. Atenda aos acordos de nível de serviço com responsabilidades claramente atribuídas. Implemente um modelo seguindo o sol entre equipes globais ou mantenha um agendamento estruturado sob chamada. Configure alertas para notificar o engenheiro de chamada ou a equipe sempre que um alerta for disparado.
Gerenciar trabalho repetitivo
Automatize tarefas operacionais repetitivas para eliminar erros manuais e reduzir a carga operacional. Use os serviços do Azure para lidar com o trabalho de rotina, permitindo que sua equipe se concentre em tarefas estratégicas.
Caso de Uso | Exemplos |
---|---|
Automação | Automatize os fluxos de trabalho em Placas do Azure ou no sistema ITSM. Modelos para itens de trabalho "Solicitação de Alteração" e "Incidente". |
Resposta a incidente | Para gerar tíquetes de incidentes com campos padrão preenchidos automaticamente, integre o Azure Monitor e a Integridade do Serviço do Azure ao sistema de tíquetes. |
Gerenciamento de alterações | Use os Aplicativos Lógicos do Azure para aprovar automaticamente alterações de baixo risco ou autoremediar determinados incidentes. |
Conformidade | Use o Azure Policy para impor e monitorar a conformidade com a nuvem. |
Segurança | Use o Microsoft Defender para Nuvem e o Microsoft Sentinel para automatizar a detecção e a resposta de ameaças à segurança. Use a Governança de ID do Microsoft Entra para examinar permissões e automatizar o gerenciamento de permissões. |
Melhorar as operações
Otimize seu ambiente de nuvem do Azure promovendo melhorias contínuas. Avalie regularmente as operações e priorize o aprendizado e os comentários contínuos. Siga estas etapas:
Examine as operações para melhorar. Siga as práticas recomendadas para monitorar a integridade, a conformidade, a segurança, os custos, os dados e os recursos de nuvem. Realize revisões operacionais semanais para discutir as principais métricas, incidentes recentes, alterações implantadas e riscos previstos. Resolva ativamente a expansão de recursos e a dívida técnica.
Treine para operações. Promova o desenvolvimento contínuo de habilidades priorizando recursos essenciais de aprendizagem. Manter operações dinâmicas de nuvem por meio de ambientes práticos de treinamento.
Treinamento de operações Descrição Obter credenciais Defina metas para credenciais da Microsoft, como habilidades aplicadas e Certificações da Microsoft para criar experiência. Usar recursos operacionais Consulte os recursos de gerenciamento do Azure. Usar a documentação do produto Use o Microsoft Learn para encontrar diretrizes sobre os serviços do Azure. Obtenha treinamento prático Incentive o treinamento prático em ambientes de área restrita que não sejam de produção.
Recursos de gerenciamento do Azure
Categoria | Recurso de gerenciamento | Descrição |
---|---|---|
Conformidade | Governança do CAF | Estrutura de governança de nuvem da Microsoft |
Segurança | Gerenciar operações de segurança | Diretrizes para gerenciar operações de segurança |
Segurança | Ferramenta de segurança da Microsoft | Uma lista das ferramentas de segurança da Microsoft e do Azure |
Segurança | Segurança da carga de trabalho | Diretrizes da carga de trabalho para segurança |
Gestão de recursos | Estratégia de nomenclatura e marcação | Recomendações de nomenclatura e marcação para gerenciar recursos |
Gestão de recursos | Abreviação do Azure | Lista de abreviações para recursos do Azure |
Gestão de recursos | Assistente do Azure | Um assistente digital para se alinhar às práticas recomendadas do Azure. |
Gestão de recursos | Regras de nomenclatura do Azure | Regras de nomenclatura para todos os recursos do Azure |
Gestão de recursos | Guias de serviço do Azure | Diretrizes para decisões de configuração de serviço |
Desenvolvimento | Desenvolvimento de software de carga de trabalho | Diretrizes de carga de trabalho para desenvolvimento de software |
Desenvolvimento | Centro de Arquitetura do Azure | Arquiteturas e guias para diferentes casos de uso |
Desenvolvimento | Hub de recursos do desenvolvedor | Um hub para ferramentas e recursos para desenvolvedores |
Implantação | Modelos Bicep, Terraform e ARM | Modelos de IaC para cada recurso do Azure |
Implantação | Pares de região do Azure | Lista de regiões emparelhadas do Azure |
Implantação | Diretório dos Serviços de Nuvem do Azure | Diretório de todos os serviços do Azure |
Implantação | Desdobramento de carga de trabalho | Diretrizes de carga de trabalho para integração contínua |
Monitorização | Monitorar seu ambiente de nuvem do Azure | Diretrizes abrangentes de monitoramento do Azure |
Monitorização | Monitoramento de carga de trabalho | Diretrizes de carga de trabalho para monitoramento |
Custo | Gerenciar custos | Diretrizes de gerenciamento de custos |
Custo | Otimização de custo da carga de trabalho | Diretrizes de carga de trabalho para otimização de custo |
Fiabilidade | Gerenciar confiabilidade de dados | Diretrizes para manter a confiabilidade dos dados |
Fiabilidade | Gerenciar confiabilidade de recursos de nuvem | Diretrizes para manter a confiabilidade do recurso |
Fiabilidade | Gerenciar incidentes de segurança | Recomendações para responder a incidentes de segurança |
Desempenho | Eficiência de desempenho da carga de trabalho | Diretrizes de carga de trabalho para eficiência de desempenho |