Explorar o programa de Resiliência Empresarial e Gestão de Crises (ERCM) da Microsoft

Concluído

A resiliência é um componente crítico da disponibilidade do serviço Microsoft, mas até mesmo serviços resilientes podem ser afetados por eventos inesperados. O Programa de Resiliência Empresarial e Gestão de Crises (ERCM) da Microsoft ajuda a garantir que os nossos serviços online estão preparados para recuperar rapidamente de eventos inesperados.

Estrutura da equipa ERCM

O Office do Programa ERCM fornece governação, supervisão e suporte para a gestão da continuidade do negócio (BCM) em toda a Microsoft. O Conselho de Continuidade de Negócios relacionado dos representantes de gerenciamento sênior da Microsoft é criado para impulsionar o patrocínio de continuidade dos negócios, o reconhecimento, a alocação de recursos e a responsabilidade do programa em suas respectivas unidades de negócios. Juntas, essas equipes impulsionam a conformidade com a estrutura bcm (gerenciamento de continuidade de negócios) da Microsoft em toda a empresa.

Cada unidade empresarial da Microsoft é necessária para cumprir os objetivos do programa Microsoft ERCM. Para suportar os objetivos da ERCM, cada unidade de negócio designa um representante, ou Oportunidade Potencial de Continuidade de Negócio (BCL), para liderar e coordenar as atividades de implementação do ERCM na unidade de negócio. Esse representante serve como o principal ponto de contato para todos os problemas de continuidade e resiliência. A maioria das BCLs depende de uma equipe de indivíduos para ajudar a executar programas de continuidade dentro de sua unidade de negócios. Esses indivíduos geralmente são chamados de Campeões, Especialistas no Assunto (SMEs) ou Gerentes de Programa.

O Programa ERCM do Office mantém uma base de dados de todas as serviços online, incluindo dependências upstream e a jusante, que servem como um repositório central para informações de continuidade de negócio em toda a nossa serviços online. Ele também registra todas as documentações, revisões e datas de teste relevantes. As equipas de serviço são notificadas automaticamente quando a documentação ou os processos do ERCM precisam de ser atualizados ou testados.

O Office do Programa ERCM e os BCLs de serviços individuais trabalham com o Microsoft Enterprise Governance Risk & Compliance (EGRC) para destacar quaisquer riscos ao nível da empresa que sejam identificados como parte do teste e revisão anuais do plano. Os riscos realçados dessa maneira recebem uma classificação de risco, um proprietário para conduzir a correção e são rastreados até serem resolvidos. A coordenação da ERCM tem uma abordagem One Microsoft e resulta numa relação muito unida entre as equipas parceiras. A lista seguinte descreve as equipas envolvidas nas atividades do ERCM relacionadas com o Microsoft 365:

  • EGRC (Risco e Conformidade de Governança Empresarial) – Equipe responsável por relatórios de nível empresarial sobre risco/conformidade e localização de padrões atuais de segurança da informação que se alinham com a Política de Segurança da Microsoft, procedimentos de implementação e padrões reconhecidos do setor. Gere o risco geral para a Microsoft, incluindo os riscos associados à ERCM.
  • ERCM Program Office – Equipa responsável pela gestão do programa Microsoft ERCM, incluindo normas de resiliência, política, formação e métricas.
  • Conselho de Continuidade dos Negócios – Representantes sêniores de cada função de negócios/engenharia, como Microsoft 365, que colaboram em planos entre grupos e na política geral.
  • Clientes potenciais de continuidade de negócios – indivíduos de cada serviço que levam a esforços de continuidade e resiliência dentro de sua unidade de negócios (por exemplo, Azure, Microsoft 365, Dynamics).
  • Campeões de continuidade dos negócios – indivíduos de cada equipe de serviço, como o Exchange Online ou o Microsoft Teams, que lideram os esforços de BCDR (Continuidade dos Negócios e Recuperação de Desastre) para sua equipe de serviço (por exemplo, Armazenamento de Blobs do Azure, Exchange e Power BI).
  • DevOps de carga de trabalho – Engenheiros dentro de equipes de serviço responsáveis pelo desenvolvimento de recursos, operações diárias e suporte a problemas de site ativo, incluindo responsabilidades de BCDR (por exemplo, gerentes de incidentes, engenheiros de chamada, equipes de DevOps).
  • Comunicação e Coordenação de Incidentes do Microsoft 365 – Microsoft 365 que funciona como um hub central para comunicação interna e externa durante um incidente dos Serviços Microsoft 365, responsável pela notificação do cliente de incidentes que afetam o serviço por meio do Painel de Integridade do Serviço do Microsoft 365 e de outras plataformas de comunicação.
  • Atendimento ao Cliente e Suporte – Equipe responsável por lidar com problemas relatados pelo cliente. Serve como um primeiro ponto de contato para clientes em caso de desastre.

Estrutura do BCM

Além de facilitar a cooperação em matéria de continuidade de negócio, o programa ERCM da Microsoft fornece um quadro BCM consistente que é implementado por unidades de negócio em toda a empresa. Essa estrutura aborda a recuperação e a continuidade de funções, serviços e dados de negócios críticos necessários para manter um nível aceitável de operações durante um incidente. O uso de uma estrutura comum garante a existência de planos, sistemas e processos eficazes, confiáveis e bem testados que podem ser contados para dar suporte à continuidade dos negócios e minimizar os impactos adversos durante um evento de interrupção.

Diagrama que mostra como o programa ERCM funciona com as Unidades de Negócio da Microsoft. O programa ERCM é responsável pela governação, conformidade e orientação. As Unidades de Negócio da Microsoft são responsáveis por seguir a metodologia e a política ERCM e colaborar com o programa ERCM em diferentes aspetos.

Ciclo de vida do BCM

O ciclo de vida do BCM está no núcleo da nossa metodologia de BCM. Esse processo foi projetado para ser adaptável para que possa ser implementado por uma ampla variedade de modelos de negócios na Microsoft. As fases do ciclo de vida do BCM orientam cada unidade empresarial da Microsoft através do desenvolvimento e implementação de planos eficazes de continuidade de negócio e resiliência.

O ciclo de vida do BCM inclui três fases de alto nível. Ele começa com um de Avaliação, que envolve a identificação de processos e objetivos críticos que devem ser incluídos no programa de continuidade dos negócios. A planejamento se concentra no desenvolvimento e na implementação de estratégias de resiliência e recuperação, bem como documentá-las em planos oficiais de continuidade de negócios. Por fim, validação de funcionalidade os planos de continuidade de negócios e suas implementações para verificar a eficácia e identificar melhorias.

Um diagrama do ciclo de vida do BCM - avaliação, planejamento e validação de capacidade.

Saiba mais