Práticas recomendadas para HA (alta disponibilidade) e replicação entre regiões no Azure Cosmos DB for MongoDB vCore
APLICA-SE AO: MongoDB vCore
Garantir a alta disponibilidade e habilitar a replicação entre regiões é essencial para aplicativos críticos usando o Azure Cosmos DB for MongoDB vCore. Este documento descreve as práticas recomendadas para configurar e gerenciar HA (alta disponibilidade) e replicação entre regiões. Siga as diretrizes neste documento para obter recursos ideais de desempenho, resiliência e recuperação de desastre no Azure Cosmos DB for MongoDB vCore.
Práticas recomendadas de HA (alta disponibilidade)
Usar HA para clusters de produção
Habilitar a HA (alta disponibilidade) é crucial para clusters de produção e clusters sensíveis a tempo de inatividade. Em um ambiente de produção, falhas inesperadas de nó podem causar interrupções significativas. A HA garante que seu cluster permaneça disponível e operacional com perda de dados zero mesmo quando um de seus fragmentos físicos (nós) fica indisponível.
Usar a HA para alcançar um SLA de 99,99%
O Azure Cosmos DB for MongoDB vCore oferece um SLA de disponibilidade mensal de 99,99% para clusters com alta disponibilidade habilitada. Para atender a esse SLA, verifique se a HA está ativada para todas as cargas de trabalho críticas que exigem tempo de atividade contínuo.
Habilitar a HA para failover automático
Clusters com alta disponibilidade habilitada recuperam-se automaticamente de falhas físicas de fragmentos sem intervenção manual. Quando ocorre uma falha de nó, o sistema promove um fragmento físico em espera para substituir o nó primário com falha. O processo de failover automático mantém a mesma cadeia de conexão, de modo que o processo de failover seja contínuo e transparente para os aplicativos. Esse recurso é fundamental para aplicativos que exigem tempo de atividade contínuo e acesso consistente a dados.
Desabilitar a HA para clusters de não produção
Para clusters de não produção ou clusters que não são sensíveis ao tempo de inatividade, a alta disponibilidade pode ser desabilitada para reduzir os custos. Esses ambientes podem tolerar tempo de inatividade ocasional sem afetar as operações de negócios. Avalie cuidadosamente as compensações de risco e custo antes de desabilitar a HA em qualquer cluster.
Usar HA com zonas de disponibilidade
Em regiões em que há suporte para zonas de disponibilidade, habilitar a HA garante que cada par de fragmentos físicos de espera primária seja provisionado em zonas de disponibilidade diferentes. A redundância de zona fornece resiliência extra protegendo seu cluster contra falhas no nível do data center em uma região.
Melhores práticas de replicação entre regiões
Usar a replicação entre regiões para recuperação de desastre
Use a replicação entre regiões quando uma cópia dos dados do cluster precisar ser armazenada em outra região do Azure para fins de DR (recuperação de desastre). A replicação entre regiões garante que seus dados estão disponíveis mesmo no caso de uma interrupção regional. O Azure Cosmos DB for MongoDB vCore dá suporte à configuração de replicação ativa-passiva para facilitar a recuperação de desastre entre regiões. A replicação ativa-passiva mantém um cluster como o principal no modo de leitura/gravação e mantém um cluster de réplica somente leitura em outra região do Azure.
Se houver uma interrupção regional rara, o cluster de réplicas poderá ser promovido para se tornar o novo cluster de leitura/gravação com interrupção mínima. Essa funcionalidade garante que seus dados permaneçam seguros e acessíveis mesmo que uma região inteira sofra uma interrupção.
Configurar a replicação com impacto mínimo no desempenho
Ao configurar a replicação entre regiões, considere a latência de rede e o impacto na latência de gravação em seus aplicativos. Escolha regiões para os clusters primários de leitura/gravação e réplica que estejam geograficamente próximos aos seus usuários e verifique se seus aplicativos são otimizados para uma eventual consistência.
Dimensionamento de leitura
Use a replicação entre regiões para descarregar operações de leitura maciças do cluster primário para um cluster de réplica. O descarregamento de operações de leitura em um cluster de réplica impede a sobrecarga do cluster primário e garante que o sistema possa lidar com volumes de leitura altos com eficiência.
Estratégia combinada de HA e DR
Combine HA (alta disponibilidade) para disponibilidade na região com replicação entre regiões para DR (recuperação de desastre) e escalabilidade de leitura global. A combinação dos dois fornece um SLA de 99,995%. Essa abordagem fornece o melhor equilíbrio entre resiliência local e redundância global, garantindo disponibilidade contínua e desempenho ideal para seus aplicativos.
Resumo de práticas recomendadas
Cenário | Recomendação |
---|---|
Clusters de produção | Habilitar alta disponibilidade |
Clusters que exigem SLA de 99,99% | Habilitar alta disponibilidade |
Clusters que exigem SLA de 99,995% | Habilitar alta disponibilidade e criar um cluster de réplica |
Clusters de não produção | Desabilitar alta disponibilidade para reduzir custos |
Requisito de failover automático | Habilitar alta disponibilidade |
DR (recuperação de desastre) entre regiões | Criar um cluster de réplica |
Escalabilidade de leitura em várias regiões | Criar um cluster de réplica |
Seguindo essas práticas recomendadas, você pode garantir que os clusters vCore do Azure Cosmos DB for MongoDB permaneçam altamente disponíveis e resilientes contra falhas e interrupções regionais.