Compartilhar via


Práticas recomendadas para HA (alta disponibilidade) e replicação entre regiões no Azure Cosmos DB for MongoDB vCore

APLICA-SE AO: MongoDB vCore

Garantir a alta disponibilidade e habilitar a replicação entre regiões é essencial para aplicativos críticos usando o Azure Cosmos DB for MongoDB vCore. Este documento descreve as práticas recomendadas para configurar e gerenciar HA (alta disponibilidade) e replicação entre regiões. Siga as diretrizes neste documento para obter recursos ideais de desempenho, resiliência e recuperação de desastre no Azure Cosmos DB for MongoDB vCore.

Práticas recomendadas de HA (alta disponibilidade)

Usar HA para clusters de produção

Habilitar a HA (alta disponibilidade) é crucial para clusters de produção e clusters sensíveis a tempo de inatividade. Em um ambiente de produção, falhas inesperadas de nó podem causar interrupções significativas. A HA garante que seu cluster permaneça disponível e operacional com perda de dados zero mesmo quando um de seus fragmentos físicos (nós) fica indisponível.

Usar a HA para alcançar um SLA de 99,99%

O Azure Cosmos DB for MongoDB vCore oferece um SLA de disponibilidade mensal de 99,99% para clusters com alta disponibilidade habilitada. Para atender a esse SLA, verifique se a HA está ativada para todas as cargas de trabalho críticas que exigem tempo de atividade contínuo.

Habilitar a HA para failover automático

Clusters com alta disponibilidade habilitada recuperam-se automaticamente de falhas físicas de fragmentos sem intervenção manual. Quando ocorre uma falha de nó, o sistema promove um fragmento físico em espera para substituir o nó primário com falha. O processo de failover automático mantém a mesma cadeia de conexão, de modo que o processo de failover seja contínuo e transparente para os aplicativos. Esse recurso é fundamental para aplicativos que exigem tempo de atividade contínuo e acesso consistente a dados.

Desabilitar a HA para clusters de não produção

Para clusters de não produção ou clusters que não são sensíveis ao tempo de inatividade, a alta disponibilidade pode ser desabilitada para reduzir os custos. Esses ambientes podem tolerar tempo de inatividade ocasional sem afetar as operações de negócios. Avalie cuidadosamente as compensações de risco e custo antes de desabilitar a HA em qualquer cluster.

Usar HA com zonas de disponibilidade

Em regiões em que há suporte para zonas de disponibilidade, habilitar a HA garante que cada par de fragmentos físicos de espera primária seja provisionado em zonas de disponibilidade diferentes. A redundância de zona fornece resiliência extra protegendo seu cluster contra falhas no nível do data center em uma região.

Melhores práticas de replicação entre regiões

Usar a replicação entre regiões para recuperação de desastre

Use a replicação entre regiões quando uma cópia dos dados do cluster precisar ser armazenada em outra região do Azure para fins de DR (recuperação de desastre). A replicação entre regiões garante que seus dados estão disponíveis mesmo no caso de uma interrupção regional. O Azure Cosmos DB for MongoDB vCore dá suporte à configuração de replicação ativa-passiva para facilitar a recuperação de desastre entre regiões. A replicação ativa-passiva mantém um cluster como o principal no modo de leitura/gravação e mantém um cluster de réplica somente leitura em outra região do Azure.

Se houver uma interrupção regional rara, o cluster de réplicas poderá ser promovido para se tornar o novo cluster de leitura/gravação com interrupção mínima. Essa funcionalidade garante que seus dados permaneçam seguros e acessíveis mesmo que uma região inteira sofra uma interrupção.

Configurar a replicação com impacto mínimo no desempenho

Ao configurar a replicação entre regiões, considere a latência de rede e o impacto na latência de gravação em seus aplicativos. Escolha regiões para os clusters primários de leitura/gravação e réplica que estejam geograficamente próximos aos seus usuários e verifique se seus aplicativos são otimizados para uma eventual consistência.

Dimensionamento de leitura

Use a replicação entre regiões para descarregar operações de leitura maciças do cluster primário para um cluster de réplica. O descarregamento de operações de leitura em um cluster de réplica impede a sobrecarga do cluster primário e garante que o sistema possa lidar com volumes de leitura altos com eficiência.

Estratégia combinada de HA e DR

Combine HA (alta disponibilidade) para disponibilidade na região com replicação entre regiões para DR (recuperação de desastre) e escalabilidade de leitura global. A combinação dos dois fornece um SLA de 99,995%. Essa abordagem fornece o melhor equilíbrio entre resiliência local e redundância global, garantindo disponibilidade contínua e desempenho ideal para seus aplicativos.

Resumo de práticas recomendadas

Cenário Recomendação
Clusters de produção Habilitar alta disponibilidade
Clusters que exigem SLA de 99,99% Habilitar alta disponibilidade
Clusters que exigem SLA de 99,995% Habilitar alta disponibilidade e criar um cluster de réplica
Clusters de não produção Desabilitar alta disponibilidade para reduzir custos
Requisito de failover automático Habilitar alta disponibilidade
DR (recuperação de desastre) entre regiões Criar um cluster de réplica
Escalabilidade de leitura em várias regiões Criar um cluster de réplica

Seguindo essas práticas recomendadas, você pode garantir que os clusters vCore do Azure Cosmos DB for MongoDB permaneçam altamente disponíveis e resilientes contra falhas e interrupções regionais.