Topologia de serviço de dados
Em um alto nível, a topologia de serviço de dados para a plataforma de dados da Contoso pode ser ilustrada como: Este diagrama lógico abstrai as principais funções do ecossistema de dados da Contoso em uma exibição simplificada e de alto nível. Essa visão abstrata dá suporte às seções que abrangem as implantações de cenário, de acordo com a seleção da estratégia de recuperação de desastres (DR) e a segregação de responsabilidades em um processo de recuperação de serviço.
Impacto da DR vs atividade do cliente
As seções a seguir apresentam um detalhamento da atividade da Contoso necessária em eventos de DR de impactos variados.
Área: Componentes fundamentais
ID do Microsoft Entra, incluindo direitos de função
- Seleção de SKU da Contoso: Premium P1
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: N/A
Grupos de Gestão
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: N/A
Subscrições
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: N/A
Azure Key Vault
- Seleção de SKU da Contoso: padrão
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: N/A
Azure Monitor
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: N/A
Microsoft Defender para Cloud
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: N/A
Cost Management
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: N/A
Azure DNS
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: N/A
Observador de rede
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: N/A
Cofre dos Serviços de Recuperação
- Seleção de SKU da Contoso: padrão (armazenamento com redundância geográfica (GRS))
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: N/A
- Observações
- A restauração entre regiões habilitará exercícios de DR e o cliente fará failover para a região secundária.
Redes virtuais (VNets), incluindo sub-redes, rotas definidas pelo usuário (UDRs) ou grupos de segurança de rede (NSGs)
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: a Contoso precisaria reimplantar as VNets da plataforma Foundation e Data com seus UDRs ou NSGs anexados na região secundária.
- Observações
- O Gerenciador de Tráfego pode ser usado para rotear geograficamente o tráfego entre regiões que contêm réplicas de estruturas VNet. Se eles tiverem o mesmo espaço de endereço, não poderão ser conectados à rede local, pois isso causaria problemas de roteamento. No momento de um desastre e perda de uma VNet em uma região, você pode conectar a outra VNet na região disponível, com o espaço de endereço correspondente à sua rede local.
Grupos de Recursos
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: a Contoso precisaria reimplantar os grupos de Recursos da plataforma Foundation e Data na região secundária.
- Observações
- Esta atividade seria mitigada pela implementação da estratégia "Warm Spare", tendo a topologia de rede e grupo de recursos disponível na região secundária.
Azure Firewall
- Seleção de SKU da Contoso: padrão
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário.
- Falha regional do Azure: a Contoso precisaria reimplantar os Firewalls do Azure Foundation na região secundária.
- Observações
- O Firewall do Azure pode ser criado com Zonas de Disponibilidade para aumentar a disponibilidade.
- Uma estratégia de "Warm Spare" mitigaria esta atividade.
Azure DDoS
- Seleção de SKU da Contoso: Proteção de rede
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: a Contoso precisaria criar um plano de proteção contra DDoS para as redes virtuais da Fundação na região secundária.
Rota Expressa – Circuito
- Seleção de SKU da Contoso: padrão
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: N/A
- Observações
- O circuito físico continuaria a ser da responsabilidade da Microsoft e do parceiro de conectividade para recuperar.
Gateway de VPN
- Seleção de SKU da Contoso: VpnGw1
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário.
- Falha regional do Azure: a Contoso precisaria reimplantar os Gateways de VPN de Base na região secundária.
- Observações
- Os Gateways VPN podem ser criados com Zonas de Disponibilidade para maior disponibilidade.
- Uma estratégia de "Warm Spare" mitigaria esta atividade.
Balanceador de Carga
- Seleção de SKU da Contoso: padrão
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário.
- Falha regional do Azure: a Contoso precisaria reimplantar os Balanceadores de Carga de Base na região secundária
- Observações
- Dependendo da região primária, um design redundante de zona ou inter-regional pode ser usado para elevar essa postura.
Azure DevOps
- Seleção de SKU da Contoso: Serviços de DevOps
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: N/A
- Observações
- Os Serviços de DevOps são criados com base no backbone do Azure e usam o armazenamento de blob do Azure com replicação geográfica para garantir resiliência.
Área: Componentes da plataforma de dados
Conta de Armazenamento – Azure Data Lake Gen2
- Seleção de SKU da Contoso: armazenamento com redundância local (LRS)
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário.
- Falha regional do Azure: a Contoso precisaria reimplantar as Contas de Armazenamento da Plataforma de Dados e reidratá-las com dados na região secundária.
- Observações
- As contas de armazenamento têm uma ampla gama de opções de redundância de dados, desde redundância de região primária até redundância de região secundária.
- Para a região secundária, os dados de redundância são replicados para a região secundária de forma assíncrona. Uma falha que afeta a região primária pode resultar em perda de dados se a região primária não puder ser recuperada. O Armazenamento do Azure normalmente tem um RPO (Recovery Point Objetive, objetivo de ponto de recuperação) de menos de 15 minutos.
- No caso de uma interrupção regional, as contas de armazenamento que são redundantes geograficamente estariam disponíveis na região secundária como LRS. Uma configuração adicional precisaria ser aplicada para elevar esses componentes na região secundária para serem redundantes geograficamente.
Azure Synapse - Pipelines
- Seleção de SKU da Contoso: Gen2 otimizada computada
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: a Contoso precisaria implantar e restaurar a plataforma de dados Azure Synapse Analytics na região secundária e reimplantar os pipelines.
- Observações
- Os pontos de restauração automática são excluídos após sete dias.
- Pontos de restauração definidos pelo usuário estão disponíveis. Atualmente, há um limite de 42 pontos de restauração definidos pelo usuário que são excluídos automaticamente após sete dias.
- O Synapse também pode executar uma restauração de banco de dados na região local ou remota e, em seguida, PAUSAR imediatamente a instância. Esse processo incorrerá apenas em custos de armazenamento – e terá custos de computação zero. Isso oferece uma maneira de manter uma cópia de banco de dados "ao vivo" em intervalos específicos.
Hubs de Eventos do Azure
- Seleção de SKU da Contoso: padrão
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: a Contoso precisaria reimplantar a instância dos Hubs de Eventos na região secundária.
- Observações
- Quando você usa o portal do Azure, a redundância de zona por meio do suporte para zonas de disponibilidade é habilitada automaticamente, isso pode ser desabilitado usando os comandos CLI ou PowerShell do Azure.
- Essa resiliência pode ser estendida para cobrir uma interrupção completa da região com a recuperação de desastres geográficos.
Azure IoT Hubs
- Seleção de SKU da Contoso: padrão
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: a Contoso precisaria reimplantar o Hub IoT na região secundária.
- Observações
- O Hub IoT fornece HA Intrarregião e usará automaticamente uma zona de disponibilidade se criada em um conjunto predefinido de regiões do Azure.
Azure Stream Analytics
- Seleção de SKU da Contoso: padrão
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: a Contoso precisaria reimplantar o Hub IoT na região secundária.
- Observações
- Um dos principais recursos do Stream Analytics é sua capacidade de se recuperar de uma falha de Nó.
Serviços de IA do Azure (anteriormente Serviços Cognitivos)
- Seleção de SKU da Contoso: pague conforme o uso
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: N/A
Azure Machine Learning
- Seleção de SKU da Contoso: Uso Geral – instâncias da Série D
- Impacto da DR
- Falha do datacenter do Azure: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário.
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário.
- Falha regional do Azure: a Contoso precisaria reimplantar o Machine Learning na região secundária.
- Observações
- Enquanto a infraestrutura de Machine Learning é gerenciada pela Microsoft; Os recursos associados são geridos pelo cliente. Apenas o Cofre da Chave está altamente disponível por padrão.
- Dependendo da criticidade do serviço suportado, a Microsoft recomenda uma implantação multirregional.
Azure Synapse – Data Explorer Pools
- Seleção de SKU da Contoso: Otimizado Computado, Pequeno (4 núcleos)
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: a Contoso precisaria reimplantar o Azure Synapse – Pools e pipelines do Data Explorer na região secundária.
Azure Synapse – Piscinas de faíscas
- Seleção de SKU da Contoso: Gen2 otimizada para computação
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: a Contoso precisaria reimplantar o Azure Synapse – Spark Pools e pipelines na região secundária.
- Observações
- Se um metastore externo do Hive for usado, isso também precisará de uma estratégia de recuperação em vigor.
- O Azure Site Recovery pode ser usado para um metastore do SQL Server.
- Um metastore MySQL usaria o recurso de restauração geográfica ou réplicas de leitura entre regiões.
- Se um metastore externo do Hive for usado, isso também precisará de uma estratégia de recuperação em vigor.
Azure Synapse – Pools SQL dedicados e sem servidor
- Seleção de SKU da Contoso: Gen2 otimizada para computação
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: a Contoso precisaria implantar e restaurar a plataforma de dados Azure Synapse Analytics na região secundária.
- Observações
- Os pontos de restauração automática são excluídos após sete dias.
- Pontos de restauração definidos pelo usuário estão disponíveis. Atualmente, há um limite de 42 pontos de restauração definidos pelo usuário que são excluídos automaticamente após sete dias.
- O Synapse também pode executar uma restauração de banco de dados na região local ou remota e, em seguida, PAUSAR imediatamente a instância. Isso só incorrerá em custos de armazenamento – e terá custos de computação zero. Esta solução oferece uma maneira de manter uma cópia de banco de dados "ao vivo" em intervalos específicos.
Power BI
- Seleção de SKU da Contoso: Power BI Pro
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: N/A
- Observações
- O cliente não precisará fazer nada se a interrupção for decidida/declarada pela equipe do Power BI.
- Uma instância de serviço do Power BI com failover só dá suporte a operações de leitura. Os relatórios que usam o Direct Query ou o Live Connect não funcionarão durante um failover.
- O cliente não precisará fazer nada se a interrupção for decidida/declarada pela equipe do Power BI.
BD do Cosmos para o Azure
- Seleção de SKU da Contoso: Gravação de região única com backup periódico
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: N/D
- Falha regional do Azure: a Contoso deve monitorar, garantindo que haja unidades de solicitação provisionadas (RUs) suficientes nas regiões restantes para dar suporte às atividades de leitura e gravação.
- Observações
- As contas de uma única região podem perder disponibilidade após uma interrupção regional. Para garantir a alta disponibilidade de sua instância do Azure Cosmos DB, configure-a com uma única região de gravação e pelo menos uma segunda região (leitura) e habilite o failover gerenciado pelo serviço.
- Para evitar a perda de disponibilidade de gravação, recomendou que as cargas de trabalho de produção sejam configuradas com "habilitar failover gerenciado por serviço", permitindo failover automático para regiões disponíveis.
Azure AI Search (anteriormente Pesquisa Cognitiva)
- Seleção de SKU da Contoso: Standard S1
- Impacto da DR
- Falha do datacenter do Azure: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário.
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário.
- Falha regional do Azure: a Contoso precisaria reimplantar a Pesquisa de IA na região secundária.
- Observações
Compartilhamento de Dados do Azure
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário.
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário.
- Falha regional do Azure: a Contoso precisaria reimplantar o Compartilhamento de Dados na região secundária.
- Observações
- Atualmente, o Compartilhamento de Dados do Azure não é suportado pelas Zonas de Disponibilidade.
- Elevar o compartilhamento de dados para uma implantação de HA abordará cada um desses riscos de paralisação.
Âmbito
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha do datacenter do Azure: N/A
- Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário.
- Falha regional do Azure: a Contoso precisaria implantar uma instância do Microsoft Purview na região secundária.
- Observações
- Esta atividade seria atenuada pela implementação da estratégia "Warm Spare", tendo uma segunda instância do Azure Microsoft Purview disponível na região secundária
- Uma abordagem "Warm Spare" tem os seguintes textos explicativos:
- As contas primárias e secundárias do Azure Microsoft Purview não podem ser configuradas para as mesmas contas de fábrica de dados do Azure, Azure Data Share e Azure Synapse Analytics, se aplicável. Como resultado, a linhagem do Azure Data Factory e do Azure Data Share não pode ser vista nas contas secundárias do Azure Microsoft Purview.
- Os tempos de execução de integração são específicos para uma conta do Azure Microsoft Purview. Portanto, se as verificações tiverem de ser executadas em contas primárias e secundárias do Azure Microsoft Purview em paralelo, vários tempos de execução de integração auto-hospedados deverão ser mantidos.
Nota
Esta secção destina-se a servir de orientação geral. A documentação do fornecedor sobre recuperação de desastres, redundância e backup deve ser consultada para a abordagem correta para um novo componente ou serviço em consideração.
"Falha do datacenter do Azure" abrange a situação em que a região afetada não tem Zonas de Disponibilidade oferecidas.
Se novas configurações ou versões atualizadas ocorrerem no ponto do evento de desastre, elas devem ser verificadas e reimplantadas (se necessário) como parte do trabalho para atualizar a plataforma até a data atual.
Próximos passos
Agora que você aprendeu sobre os detalhes do cenário, você pode aprender sobre as recomendações relacionadas a esse cenário.