Topologia de serviço de dados
Em um alto nível, a topologia de serviço de dados para a plataforma de dados da Contoso pode ser ilustrada como: Este diagrama lógico abstrai as principais funções do ecossistema de dados da Contoso em uma exibição simplificada e de alto nível. Essa exibição abstraída dá suporte às seções que abrangem as implantações de cenários, de acordo com a seleção de estratégia de DR (recuperação de desastre) e a segregação de responsabilidades em um processo de recuperação de serviços.
Impacto da DR versus atividade do cliente
As seções a seguir apresentam um detalhamento da atividade da Contoso que é necessária em eventos de DR de impactos variados.
Área: Componentes fundamentais
O Microsoft Entra ID, incluindo direitos de função
- Seleção de SKU da Contoso: Premium P1
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: N/A
Grupos de Gerenciamento
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: N/A
Assinaturas
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: N/A
Azure Key Vault
- Seleção de SKU da Contoso: Standard
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: N/A
Azure Monitor
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: N/A
Microsoft Defender para Nuvem
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: N/A
Gerenciamento de Custos
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: N/A
DNS do Azure
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: N/A
Observador de Rede
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: N/A
Cofre dos Serviços de Recuperação
- Seleção de SKU da Contoso: padrão (GRS (armazenamento com redundância geográfica))
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: N/A
- Notas
- A Restauração entre Regiões permitirá análises de DR e o failover do cliente para a região secundária.
Redes virtuais (VNets), incluindo sub-redes, UDRs (rotas definidas pelo usuário) e NSGs (grupos de segurança de rede)
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: a Contoso precisaria reimplantar as VNets da plataforma de dados e base com seus UDRs e NSGs anexados na região secundária.
- Notas
- O Gerenciador de Tráfego pode ser usado para rotear geograficamente o tráfego entre regiões que contêm estruturas VNet de réplica. Se tiverem o mesmo espaço de endereço, não poderão ser conectados à rede local, pois isso causaria problemas de roteamento. No momento de um desastre e da perda de uma VNET em uma região, você pode conectar a outra VNET na região disponível com o espaço de endereço correspondente à rede local.
Grupos de recursos
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: a Contoso precisaria reimplantar os grupos de recursos da plataforma de dados e do Foundation na região secundária.
- Notas
- Essa atividade seria atenuada implementando a estratégia "Warm Spare", tendo a topologia de rede e grupo de recursos disponível na região secundária.
Firewall do Azure
- Seleção de SKU da Contoso: Standard
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
- Falha regional do Azure: a Contoso precisaria reimplantar os Firewalls do Azure Foundation na região secundária.
- Notas
- O Firewall do Azure pode ser criado com Zonas de Disponibilidade para aumentar a disponibilidade.
- Uma estratégia de "Warm Spare" mitigaria essa atividade.
Azure DDoS
- Seleção de SKU da Contoso: Proteção de Rede
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: a Contoso precisaria criar um plano de proteção contra DDoS para as VNets da Fundação na região secundária.
ExpressRoute – Circuito
- Seleção de SKU da Contoso: Standard
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: N/A
- Notas
- O circuito físico continuaria sendo responsabilidade da Microsoft e do parceiro de conectividade para se recuperar.
Gateway de VPN
- Seleção de SKU da Contoso: VpnGw1
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
- Falha regional do Azure: a Contoso precisaria reimplantar os Gateways de VPN Foundation na região secundária.
- Notas
- Os gateways de VPN podem ser criados com zonas de disponibilidade para aumentar a disponibilidade.
- Uma estratégia de "Warm Spare" mitigaria essa atividade.
Load Balancer
- Seleção de SKU da Contoso: Standard
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
- Falha regional do Azure: a Contoso precisaria reimplantar os Foundation Load Balancers na região secundária
- Notas
- Dependendo da região primária, um design com redundância de zona ou inter-regional pode ser usado para elevar essa postura.
Azure DevOps
- Seleção de SKU da Contoso: DevOps Services
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: N/A
- Notas
- O DevOps Services é criado com base no backbone do Azure e usa o armazenamento de blobs do Azure com replicação geográfica para garantir a resiliência.
Área: componentes da Plataforma de Dados
Conta de armazenamento – Azure Data Lake Gen2
- Seleção de SKU da Contoso: LRS (armazenamento com redundância local)
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
- Falha regional do Azure: a Contoso precisaria reimplantar as contas de armazenamento da plataforma de dados e reidratá-las com dados na região secundária.
- Notas
- As contas de armazenamento têm uma ampla variedade de opções de redundância de dados, desde redundância de região primária até redundância de região secundária.
- Para a região secundária, os dados de redundância são replicados para a região secundária de maneira assíncrona. Uma falha que afeta a região primária pode resultar em perda de dados quando a região primária não pode ser recuperada. O Armazenamento do Azure normalmente tem um RPO (objetivo de ponto de recuperação) de menos de 15 minutos.
- No caso de uma interrupção regional, as contas de armazenamento com redundância geográfica estariam disponíveis na região secundária como LRS. Configuração adicional precisaria ser aplicada para elevar esses componentes na região secundária para serem georredundantes.
Azure Synapse – Pipelines
- Seleção de SKU da Contoso: Computação Otimizada Gen2
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: a Contoso precisaria implantar e restaurar a plataforma de dados Azure Synapse Analytics na região secundária e reimplantar os pipelines.
- Notas
- Os pontos de restauração automática são excluídos após sete dias.
- Os pontos de restauração definidos pelo usuário estão disponíveis. Atualmente, há um teto de 42 pontos de restauração definidos pelo usuário que são excluídos automaticamente após sete dias.
- O Synapse também pode executar uma restauração de BD na região local ou remota e, em seguida, PAUSAR a instância imediatamente. Esse processo gerará apenas custos de armazenamento e terá custo zero de computação. Isso oferece uma maneira de manter uma cópia de banco de dados "ativa" em intervalos específicos.
Hubs de eventos do Azure
- Seleção de SKU da Contoso: Standard
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: a Contoso precisaria reimplantar a instância dos Hubs de Eventos na região secundária.
- Notas
- Quando você usa o portal do Azure, a redundância de zona por meio do suporte para zonas de disponibilidade é habilitada automaticamente, isso pode ser desabilitado usando a CLI do Azure ou os comandos do PowerShell.
- Essa resiliência pode ser estendida para cobrir uma interrupção de região completa com a recuperação de desastre geográfico.
Hubs IoT do Azure
- Seleção de SKU da Contoso: Standard
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: a Contoso precisaria reimplantar o Hub IoT na região secundária.
- Notas
- O Hub IoT fornece HA intrarregional e usará automaticamente uma zona de disponibilidade se criada em um conjunto predefinido de regiões do Azure.
Azure Stream Analytics
- Seleção de SKU da Contoso: Standard
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: a Contoso precisaria reimplantar o Hub IoT na região secundária.
- Notas
- Um recurso importante do Stream Analytics é sua capacidade de se recuperar de falhas de nó.
Serviços de IA do Azure (anteriormente Serviços Cognitivos)
- Seleção de SKU da Contoso: Pré-pago
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: N/A
Azure Machine Learning
- Seleção de SKU da Contoso: Uso Geral – Instâncias da Série D
- Impacto da DR
- Falha do datacenter do Azure: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
- Falha regional do Azure: a Contoso precisaria reimplantar o Machine Learning na região secundária.
- Notas
- Enquanto a infraestrutura do Machine Learning é gerenciada pela Microsoft; os recursos associados são gerenciados pelo cliente. Somente o Key Vault está altamente disponível por padrão.
- Dependendo da criticidade do serviço com suporte, a Microsoft recomenda uma implantação multirregional.
Azure Synapse – Pools do Data Explorer
- Seleção de SKU da Contoso: Computação Otimizada, Pequena (4 núcleos)
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: a Contoso precisaria reimplantar o Azure Synapse – Pools e pipelines do Data Explorer na região secundária.
Azure Synapse – Pools do Spark
- Seleção de SKU da Contoso: Computação Otimizada Gen2
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: a Contoso precisaria reimplantar o Azure Synapse – Pools do Spark e pipelines na região secundária.
- Notas
- Se um metastore externo do Hive for usado, isso também precisará de uma estratégia de recuperação em vigor.
- O Azure Site Recovery pode ser usado para um metastore do SQL Server.
- Um metastore MySQL usaria o recurso de restauração geográfica ou réplicas de leitura entre regiões.
- Se um metastore externo do Hive for usado, isso também precisará de uma estratégia de recuperação em vigor.
Azure Synapse – Pools de SQL dedicados e sem servidor
- Seleção de SKU da Contoso: Computação Otimizada Gen2
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: a Contoso precisaria implantar e restaurar a plataforma de dados Azure Synapse Analytics na região secundária.
- Notas
- Os pontos de restauração automática são excluídos após sete dias.
- Os pontos de restauração definidos pelo usuário estão disponíveis. Atualmente, há um teto de 42 pontos de restauração definidos pelo usuário que são excluídos automaticamente após sete dias.
- O Synapse também pode executar uma restauração de BD na região local ou remota e, em seguida, PAUSAR a instância imediatamente. Isso gerará apenas custos de armazenamento e terá custo zero de computação. Essa solução oferece uma maneira de manter uma cópia de banco de dados "ativa" em intervalos específicos.
Power BI
- Seleção de SKU da Contoso: Power BI Pro
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: N/A
- Notas
- O cliente não precisará fazer nada se a interrupção for decidida/declarada pela equipe do Power BI.
- Uma instância de serviço do Power BI com failover só dá suporte a operações de leitura. Os relatórios que usam o Direct Query ou o Live Connect não funcionarão durante um failover.
- O cliente não precisará fazer nada se a interrupção for decidida/declarada pela equipe do Power BI.
Azure Cosmos DB
- Seleção de SKU da Contoso: Gravação de Região Única com Backup periódico
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/A
- Falha regional do Azure: a Contoso deve monitorar, garantindo que haja RUs (unidades de solicitação) provisionadas suficientes nas regiões restantes para dar suporte a atividades de leitura e gravação.
- Notas
- Contas de região única poderão perder disponibilidade após uma indisponibilidade regional. Para garantir a alta disponibilidade da instância do Azure Cosmos DB, configure-a com uma única região de gravação e pelo menos uma segunda região (leitura) e habilite o failover gerenciado pelo serviço.
- Para evitar a perda de disponibilidade de gravação, ele aconselhou que as cargas de trabalho de produção fossem configuradas com "habilitar failover gerenciado pelo serviço", permitindo o failover automático para as regiões disponíveis.
Azure AI Search (anteriormente Cognitive Search)
- Seleção de SKU da Contoso: Standard S1
- Impacto da DR
- Falha do datacenter do Azure: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
- Falha regional do Azure: a Contoso precisaria reimplantar o AI Search na região secundária.
- Notas
- Não há nenhum mecanismo interno para recuperação de desastre.
- A implementação de várias réplicas do AI Search em zonas de disponibilidade resolverá o risco de interrupção do datacenter.
Azure Data Share
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
- Falha regional do Azure: a Contoso precisaria reimplantar o Data Share na região secundária.
- Notas
- No momento, não há suporte do Azure Data Share nas Zonas de Disponibilidade.
- O Uplifting Data Share para uma implantação de HA abordará cada um desses riscos de interrupção.
Purview
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário.
- Falha regional do Azure: a Contoso precisaria implantar uma instância do Microsoft Purview na região secundária.
- Notas
- Essa atividade seria atenuada implementando a estratégia "Warm Spare", tendo uma segunda instância do Azure Microsoft Purview disponível na região secundária
- Uma abordagem "Warm Spare" tem as seguintes características principais:
- As contas primárias e secundárias do Azure Microsoft Purview não podem ser configuradas para as mesmas contas do Azure Data Factory, do Azure Data Share nem do Azure Synapse Analytics, se aplicável. Como resultado, a linhagem do Azure Data Factory e do Azure Data Share não pode ser vista nas contas secundárias do Microsoft Purview do Azure.
- Os Integration Runtime são específicos de uma conta do Azure Microsoft Purview. Portanto, se as verificações precisarem ser executadas em contas primárias e secundárias do Microsoft Purview do Azure em paralelo, vários runtimes de integração auto-hospedada deverão ser mantidos.
Observação
Esta seção serve como orientação geral. A documentação do fornecedor sobre recuperação de desastres, redundância e backup deve ser consultada para a abordagem correta de um novo componente ou serviço em consideração.
"Falha do datacenter do Azure" abrange a situação em que a região afetada não tem Zonas de Disponibilidade oferecidas.
Se a configuração ou as versões novas/atualizadas ocorreram no momento do evento de desastre, elas deverão ser verificadas e reimplantadas (se necessário) como parte do trabalho para atualizar a plataforma até a data atual.
Próximas etapas
Agora que você aprendeu sobre os detalhes do cenário, pode aprender sobre as recomendações relacionadas a esse cenário.