Editar

Compartilhar via


DR para a Plataforma de Dados do Azure – Detalhes do cenário

Azure Synapse Analytics
Azure Machine Learning
Azure Cosmos DB
Azure Data Lake
Hubs de eventos do Azure

Topologia de serviço de dados

Em um alto nível, a topologia de serviço de dados para a plataforma de dados da Contoso pode ser ilustrada como: Diagrama da topologia de serviço de dados de alto nível da Contoso. Este diagrama lógico abstrai as principais funções do ecossistema de dados da Contoso em uma exibição simplificada e de alto nível. Essa exibição abstraída dá suporte às seções que abrangem as implantações de cenários, de acordo com a seleção de estratégia de DR (recuperação de desastre) e a segregação de responsabilidades em um processo de recuperação de serviços.

Impacto da DR versus atividade do cliente

As seções a seguir apresentam um detalhamento da atividade da Contoso que é necessária em eventos de DR de impactos variados.

Área: Componentes fundamentais

  • O Microsoft Entra ID, incluindo direitos de função

    • Seleção de SKU da Contoso: Premium P1
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: N/A
  • Grupos de Gerenciamento

    • Seleção de SKU da Contoso: N/A
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: N/A
  • Assinaturas

    • Seleção de SKU da Contoso: N/A
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: N/A
  • Azure Key Vault

    • Seleção de SKU da Contoso: Standard
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: N/A
  • Azure Monitor

    • Seleção de SKU da Contoso: N/A
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: N/A
  • Microsoft Defender para Nuvem

    • Seleção de SKU da Contoso: N/A
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: N/A
  • Gerenciamento de Custos

    • Seleção de SKU da Contoso: N/A
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: N/A
  • DNS do Azure

    • Seleção de SKU da Contoso: N/A
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: N/A
  • Observador de Rede

    • Seleção de SKU da Contoso: N/A
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: N/A
  • Cofre dos Serviços de Recuperação

    • Seleção de SKU da Contoso: padrão (GRS (armazenamento com redundância geográfica))
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: N/A
    • Notas
      • A Restauração entre Regiões permitirá análises de DR e o failover do cliente para a região secundária.
  • Redes virtuais (VNets), incluindo sub-redes, UDRs (rotas definidas pelo usuário) e NSGs (grupos de segurança de rede)

    • Seleção de SKU da Contoso: N/A
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: a Contoso precisaria reimplantar as VNets da plataforma de dados e base com seus UDRs e NSGs anexados na região secundária.
    • Notas
      • O Gerenciador de Tráfego pode ser usado para rotear geograficamente o tráfego entre regiões que contêm estruturas VNet de réplica. Se tiverem o mesmo espaço de endereço, não poderão ser conectados à rede local, pois isso causaria problemas de roteamento. No momento de um desastre e da perda de uma VNET em uma região, você pode conectar a outra VNET na região disponível com o espaço de endereço correspondente à rede local.
  • Grupos de recursos

    • Seleção de SKU da Contoso: N/A
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: a Contoso precisaria reimplantar os grupos de recursos da plataforma de dados e do Foundation na região secundária.
    • Notas
      • Essa atividade seria atenuada implementando a estratégia "Warm Spare", tendo a topologia de rede e grupo de recursos disponível na região secundária.
  • Firewall do Azure

    • Seleção de SKU da Contoso: Standard
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
      • Falha regional do Azure: a Contoso precisaria reimplantar os Firewalls do Azure Foundation na região secundária.
    • Notas
      • O Firewall do Azure pode ser criado com Zonas de Disponibilidade para aumentar a disponibilidade.
      • Uma estratégia de "Warm Spare" mitigaria essa atividade.
  • Azure DDoS

    • Seleção de SKU da Contoso: Proteção de Rede
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: a Contoso precisaria criar um plano de proteção contra DDoS para as VNets da Fundação na região secundária.
  • ExpressRoute – Circuito

    • Seleção de SKU da Contoso: Standard
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: N/A
    • Notas
      • O circuito físico continuaria sendo responsabilidade da Microsoft e do parceiro de conectividade para se recuperar.
  • Gateway de VPN

    • Seleção de SKU da Contoso: VpnGw1
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
      • Falha regional do Azure: a Contoso precisaria reimplantar os Gateways de VPN Foundation na região secundária.
    • Notas
      • Os gateways de VPN podem ser criados com zonas de disponibilidade para aumentar a disponibilidade.
      • Uma estratégia de "Warm Spare" mitigaria essa atividade.
  • Load Balancer

    • Seleção de SKU da Contoso: Standard
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
      • Falha regional do Azure: a Contoso precisaria reimplantar os Foundation Load Balancers na região secundária
    • Notas
  • Azure DevOps

Área: componentes da Plataforma de Dados

  • Conta de armazenamento – Azure Data Lake Gen2

    • Seleção de SKU da Contoso: LRS (armazenamento com redundância local)
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
      • Falha regional do Azure: a Contoso precisaria reimplantar as contas de armazenamento da plataforma de dados e reidratá-las com dados na região secundária.
    • Notas
      • As contas de armazenamento têm uma ampla variedade de opções de redundância de dados, desde redundância de região primária até redundância de região secundária.
      • Para a região secundária, os dados de redundância são replicados para a região secundária de maneira assíncrona. Uma falha que afeta a região primária pode resultar em perda de dados quando a região primária não pode ser recuperada. O Armazenamento do Azure normalmente tem um RPO (objetivo de ponto de recuperação) de menos de 15 minutos.
      • No caso de uma interrupção regional, as contas de armazenamento com redundância geográfica estariam disponíveis na região secundária como LRS. Configuração adicional precisaria ser aplicada para elevar esses componentes na região secundária para serem georredundantes.
  • Azure Synapse – Pipelines

    • Seleção de SKU da Contoso: Computação Otimizada Gen2
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: a Contoso precisaria implantar e restaurar a plataforma de dados Azure Synapse Analytics na região secundária e reimplantar os pipelines.
    • Notas
      • Os pontos de restauração automática são excluídos após sete dias.
      • Os pontos de restauração definidos pelo usuário estão disponíveis. Atualmente, há um teto de 42 pontos de restauração definidos pelo usuário que são excluídos automaticamente após sete dias.
      • O Synapse também pode executar uma restauração de BD na região local ou remota e, em seguida, PAUSAR a instância imediatamente. Esse processo gerará apenas custos de armazenamento e terá custo zero de computação. Isso oferece uma maneira de manter uma cópia de banco de dados "ativa" em intervalos específicos.
  • Hubs de eventos do Azure

    • Seleção de SKU da Contoso: Standard
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: a Contoso precisaria reimplantar a instância dos Hubs de Eventos na região secundária.
    • Notas
      • Quando você usa o portal do Azure, a redundância de zona por meio do suporte para zonas de disponibilidade é habilitada automaticamente, isso pode ser desabilitado usando a CLI do Azure ou os comandos do PowerShell.
      • Essa resiliência pode ser estendida para cobrir uma interrupção de região completa com a recuperação de desastre geográfico.
  • Hubs IoT do Azure

    • Seleção de SKU da Contoso: Standard
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: a Contoso precisaria reimplantar o Hub IoT na região secundária.
    • Notas
  • Azure Stream Analytics

    • Seleção de SKU da Contoso: Standard
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: a Contoso precisaria reimplantar o Hub IoT na região secundária.
    • Notas
      • Um recurso importante do Stream Analytics é sua capacidade de se recuperar de falhas de nó.
  • Serviços de IA do Azure (anteriormente Serviços Cognitivos)

    • Seleção de SKU da Contoso: Pré-pago
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: N/A
  • Azure Machine Learning

    • Seleção de SKU da Contoso: Uso Geral – Instâncias da Série D
    • Impacto da DR
      • Falha do datacenter do Azure: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
      • Falha regional do Azure: a Contoso precisaria reimplantar o Machine Learning na região secundária.
    • Notas
  • Azure Synapse – Pools do Data Explorer

    • Seleção de SKU da Contoso: Computação Otimizada, Pequena (4 núcleos)
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: a Contoso precisaria reimplantar o Azure Synapse – Pools e pipelines do Data Explorer na região secundária.
  • Azure Synapse – Pools do Spark

    • Seleção de SKU da Contoso: Computação Otimizada Gen2
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: a Contoso precisaria reimplantar o Azure Synapse – Pools do Spark e pipelines na região secundária.
    • Notas
      • Se um metastore externo do Hive for usado, isso também precisará de uma estratégia de recuperação em vigor.
  • Azure Synapse – Pools de SQL dedicados e sem servidor

    • Seleção de SKU da Contoso: Computação Otimizada Gen2
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: a Contoso precisaria implantar e restaurar a plataforma de dados Azure Synapse Analytics na região secundária.
    • Notas
      • Os pontos de restauração automática são excluídos após sete dias.
      • Os pontos de restauração definidos pelo usuário estão disponíveis. Atualmente, há um teto de 42 pontos de restauração definidos pelo usuário que são excluídos automaticamente após sete dias.
      • O Synapse também pode executar uma restauração de BD na região local ou remota e, em seguida, PAUSAR a instância imediatamente. Isso gerará apenas custos de armazenamento e terá custo zero de computação. Essa solução oferece uma maneira de manter uma cópia de banco de dados "ativa" em intervalos específicos.
  • Power BI

  • Azure Cosmos DB

    • Seleção de SKU da Contoso: Gravação de Região Única com Backup periódico
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha regional do Azure: a Contoso deve monitorar, garantindo que haja RUs (unidades de solicitação) provisionadas suficientes nas regiões restantes para dar suporte a atividades de leitura e gravação.
    • Notas
      • Contas de região única poderão perder disponibilidade após uma indisponibilidade regional. Para garantir a alta disponibilidade da instância do Azure Cosmos DB, configure-a com uma única região de gravação e pelo menos uma segunda região (leitura) e habilite o failover gerenciado pelo serviço.
      • Para evitar a perda de disponibilidade de gravação, ele aconselhou que as cargas de trabalho de produção fossem configuradas com "habilitar failover gerenciado pelo serviço", permitindo o failover automático para as regiões disponíveis.
  • Azure AI Search (anteriormente Cognitive Search)

    • Seleção de SKU da Contoso: Standard S1
    • Impacto da DR
      • Falha do datacenter do Azure: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
      • Falha regional do Azure: a Contoso precisaria reimplantar o AI Search na região secundária.
    • Notas
  • Azure Data Share

    • Seleção de SKU da Contoso: N/A
    • Impacto da DR
      • Falha do datacenter do Azure: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
      • Falha regional do Azure: a Contoso precisaria reimplantar o Data Share na região secundária.
    • Notas
  • Purview

    • Seleção de SKU da Contoso: N/A
    • Impacto da DR
      • Falha do datacenter do Azure: N/A
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
      • Falha regional do Azure: a Contoso precisaria implantar uma instância do Microsoft Purview na região secundária.
    • Notas
      • Essa atividade seria atenuada implementando a estratégia "Warm Spare", tendo uma segunda instância do Azure Microsoft Purview disponível na região secundária
      • Uma abordagem "Warm Spare" tem as seguintes características principais:
        • As contas primárias e secundárias do Azure Microsoft Purview não podem ser configuradas para as mesmas contas do Azure Data Factory, do Azure Data Share nem do Azure Synapse Analytics, se aplicável. Como resultado, a linhagem do Azure Data Factory e do Azure Data Share não pode ser vista nas contas secundárias do Microsoft Purview do Azure.
        • Os Integration Runtime são específicos de uma conta do Azure Microsoft Purview. Portanto, se as verificações precisarem ser executadas em contas primárias e secundárias do Microsoft Purview do Azure em paralelo, vários runtimes de integração auto-hospedada deverão ser mantidos.

Observação

Esta seção serve como orientação geral. A documentação do fornecedor sobre recuperação de desastres, redundância e backup deve ser consultada para a abordagem correta de um novo componente ou serviço em consideração.

"Falha do datacenter do Azure" abrange a situação em que a região afetada não tem Zonas de Disponibilidade oferecidas.

Se a configuração ou as versões novas/atualizadas ocorreram no momento do evento de desastre, elas deverão ser verificadas e reimplantadas (se necessário) como parte do trabalho para atualizar a plataforma até a data atual.

Próximas etapas

Agora que você aprendeu sobre os detalhes do cenário, pode aprender sobre as recomendações relacionadas a esse cenário.