Otimize a continuidade de negócios e a recuperação de desastres
Ao migrar recursos Oracle para o Azure, considere a confiabilidade do seu banco de dados e também a confiabilidade das camadas em máquinas virtuais (VMs), sub-redes de rede virtual e componentes de armazenamento.
O Oracle on Azure infrastructure as a service (IaaS) pode cumprir os objetivos de resiliência necessários das cargas de trabalho Oracle mais exigentes. Para usar efetivamente as orientações deste artigo, primeiro defina seus indicadores-chave de desempenho (KPIs) de resiliência com base em seus requisitos de negócios. Use seus requisitos de RTO (Recovery Time Objetive, objetivo de tempo de recuperação) e RPO (Recovery Point Objetive, objetivo de ponto de recuperação) como KPIs de linha de base para determinar a melhor arquitetura para sua carga de trabalho Oracle no Azure.
O RTO é a quantidade máxima de tempo que um aplicativo permanece indisponível após um desastre, falha ou evento comparável.
O RPO é a quantidade máxima de perda de dados após um desastre, falha ou evento comparável.
Métodos de backup para proteção de dados
Os três métodos de backup de banco de dados Oracle para uma carga de trabalho Oracle em IaaS do Azure incluem:
Streaming de backups. Use o Oracle Recovery Manager (RMAN) para esse método. O RMAN transmite backups para mídia de fita sequencial.
Os destinos de backup no Azure incluem:
- Bibliotecas de fitas virtuais que não são da Microsoft, que você pode encontrar no Azure Marketplace.
- Compartilhamentos de arquivos locais e remotos, como o Armazenamento de Blob do Azure com o protocolo Network File System, Arquivos do Azure e Arquivos NetApp do Azure.
Snapshots no nível de armazenamento. Use o Backup do Azure para esse método. Esse método depende do tipo de armazenamento que você usa para arquivos de banco de dados. Por exemplo, se você usar discos gerenciados do Azure, como o SSD Premium do Azure, o Backup do Azure se integrará ao banco de dados Oracle. Se você usar o Azure NetApp Files, poderá usar os recursos de proteção de dados do Azure NetApp Files, como backup do Azure NetApp Files e replicação entre regiões.
Backups no nível da VM. Use o Backup do Azure para esse método.
Atenção
Verifique se as VMs em seu ambiente de backup estão executando SOs que têm capacidade de suporte. Saiba mais sobre os SOs suportados.
Quando você transmite backups de bancos de dados grandes, o tempo necessário para copiar os dados e, em seguida, restaurá-los pode exceder os requisitos de RTO. Os snapshots no nível de armazenamento são a melhor opção para esse cenário.
Recomendações
Considere cuidadosamente se deve implementar uma estratégia de backup baseada em streaming, em snapshots no nível de armazenamento ou em ambas as estratégias.
Avalie o efeito da sua estratégia de backup nos requisitos de RTO e RPO.
Analise os destinos de armazenamento disponíveis para seus backups RMAN com base nos limites de taxa de transferência documentados para cada opção. Escolha a opção que atende às suas necessidades.
Considere usar o Backup do Azure para seus instantâneos no nível de armazenamento e coloque os instantâneos em uma região emparelhada ou em uma zona de disponibilidade para proteção extra.
Considere várias opções de armazenamento para armazenar os backups de log de arquivamento necessários para recuperar o banco de dados. Considere as considerações de desempenho, replicação e custo de cada opção.
Desenvolva e teste regularmente seus planos de backup e restauração para evitar surpresas indesejadas em seu ambiente de produção.
Proteção de serviços e continuidade de negócios
Esta seção descreve como melhorar a alta disponibilidade geral (HA) e a recuperação de desastres (DR) de sua carga de trabalho Oracle no Azure IaaS implementando considerações de proteção de serviço e continuidade de negócios (BC).
Incorpore as seguintes recomendações para melhorar a redundância arquitetônica e, finalmente, maximizar a quantidade de tempo que seu serviço está disponível. Procure minimizar o tempo de inatividade do serviço devido a interrupções planejadas, como patches, atualizações e upgrades, e interrupções não planejadas, como falhas. Use os recursos do Azure e da Oracle para melhorar sua recuperação de falhas em toda a geografia.
O Azure fornece muitas opções para a alta disponibilidade de componentes individuais em uma arquitetura Oracle on IaaS. Por exemplo, pode:
- Implante VMs usando um conjunto de dimensionamento de máquina virtual flexível, que distribui automaticamente as VMs entre domínios de falha.
- Crie zonas de disponibilidade para proteger contra falhas no datacenter.
- Coloque implantações em diferentes regiões para proteger contra falhas de região completa.
Vários recursos de armazenamento do Azure fornecem diferentes níveis de redundância de armazenamento, como armazenamento com redundância local, armazenamento com redundância de zona e armazenamento com redundância geográfica. Considere cada opção ao planejar a implantação da carga de trabalho Oracle na IaaS do Azure.
Você também pode usar o Oracle Data Guard, que é uma ferramenta para configurações de proteção de serviço de banco de dados Oracle. O Data Guard encaminha e aplica logs de transações a um ou mais bancos de dados em espera. Esse processo mantém cópias exatas do banco de dados primário para as quais você pode fazer failover se tiver planejado a manutenção ou um cenário de falha.
O Data Guard tem três modos de replicação de dados: proteção máxima, disponibilidade máxima e desempenho máximo. Cada modo de replicação oferece uma combinação diferente de modos de transporte de log e diferentes garantias transacionais para o aplicativo no banco de dados secundário.
Dependendo da sua estratégia, como uma estratégia de latência zero ou perda de dados zero, você pode escolher uma configuração síncrona ou assíncrona. Você também pode implementar failover de início rápido, dependendo dos seus requisitos máximos de tempo de inatividade. Estão disponíveis arquiteturas de referência que fornecem uma recuperação em menos de um minuto ou menos de cinco minutos, e até quatro horas. A Enterprise Edition do Oracle Database inclui o Data Guard.
O Oracle GoldenGate é outra ferramenta que você pode usar para replicar dados entre dois bancos de dados e habilitar cenários multiprimários. Você deve comprar GoldenGate separadamente.
Recomendações
Considere os recursos que o Azure fornece para a alta disponibilidade de vários componentes de infraestrutura em sua implementação Oracle on Azure IaaS.
Selecione cuidadosamente o modo de proteção de banco de dados que atende aos seus requisitos ao usar o Data Guard para HA e DR. Por exemplo, o modo de desempenho máximo minimiza o impacto na origem, mas tem o maior potencial de perda de dados. Para obter mais informações, consulte BCDR para Oracle no acelerador de zona de aterrissagem de Máquinas Virtuais do Azure e modos de proteção do Oracle Data Guard.
Considere automatizar seu processo de failover. Por exemplo, você pode usar failover de início rápido.
Estabeleça procedimentos de teste para seus processos de failover e realize testes regulares para evitar problemas.
Arquitete sua solução de forma holística usando recursos nativos do Azure, como zonas de disponibilidade, e ferramentas nativas do Oracle, como o Data Guard, para atender aos seus requisitos de HA e DR. Os dois exemplos a seguir usam componentes nativos do Azure e Oracle.
Criar um failover com espera passiva
Esta seção descreve um exemplo de um cenário de failover para aplicativos Oracle críticos para os negócios em uma implantação de zona de duas disponibilidades com espera passiva.
Os aplicativos Oracle críticos para os negócios, como o Oracle E-Business Suite, exigem prevenção de falhas e, portanto, uma arquitetura holística.
Este exemplo:
Tem uma implantação de zona de duas disponibilidades. A camada de aplicativo usa o Azure Site Recovery com uma VM secundária passiva.
Aproveita o recurso de failover de início rápido do Data Guard. Para obter a mais alta disponibilidade, recomendamos que você instale dois observadores. O observador primário está na zona de disponibilidade um, e o observador secundário está na zona de disponibilidade dois. Os observadores monitorizam e direcionam o tráfego. Quando o banco de dados primário não está disponível, o observador realiza automaticamente failover para o banco de dados secundário. O Data Guard executa uma sincronização de refazer. O período de tempo da sincronização de refazer depende da sua configuração de refazer.
Tem o Data Guard configurado para um modo de proteção de dados, como disponibilidade máxima, desempenho máximo ou proteção máxima. Para obter mais informações sobre como escolher um modo para seus requisitos de carga de trabalho, consulte Modos de proteção do Oracle Data Guard.
A arquitetura a seguir visa um limite de tempo de inatividade inferior a cinco minutos.
Criar um failover com o modo de espera ativo
Esta seção descreve um exemplo de um cenário de failover para aplicativos Oracle críticos para os negócios em uma implantação de zona de duas disponibilidades com espera ativa.
Neste exemplo:
A camada do servidor Web, a camada de aplicativo e a camada de banco de dados residem em sua própria sub-rede de rede virtual.
O banco de dados primário reside na zona de disponibilidade um.
O banco de dados que usa o Ative Data Guard para replicar o banco de dados primário para um modo de espera ativo reside na zona de disponibilidade três.
Nota
Esta configuração requer uma licença do Ative Data Guard.
A arquitetura a seguir visa um limite de tempo de inatividade inferior a um minuto. Este cenário de failover tem uma configuração de espera ativa, mas tem recursos somente leitura.