Princípios e preparação da Recuperação Após Desastre
Neste artigo, vamos abordar princípios importantes de recuperação após desastre (DR) para Instâncias Grandes do HANA (também conhecidas como Infraestrutura BareMetal). Vamos percorrer os passos que tem de seguir para preparar a recuperação após desastre. Também verá como alcançar o objetivo de tempo de recuperação (RTO) e o objetivo de ponto de recuperação (RPO) num desastre.
Princípios de DR para Instâncias Grandes do HANA
As Instâncias Grandes do HANA oferecem funcionalidades de recuperação após desastre entre selos de Instância Grande do HANA em diferentes regiões do Azure. Por exemplo, digamos que implementa Instâncias Grandes do HANA na região E.U.A. Oeste do Azure. Em seguida, pode utilizar as Instâncias Grandes do HANA na região E.U.A. Leste como unidades de recuperação após desastre. A recuperação após desastre não é configurada automaticamente, porque requer que pague por outra Instância Grande do HANA na região de DR. A configuração da recuperação após desastre funciona para configurações de aumento vertical e aumento horizontal.
A maioria dos clientes utiliza a unidade na região de DR para executar sistemas de não produção que utilizam uma instância HANA instalada. A Instância Grande do HANA tem de ter o mesmo SKU que o SKU utilizado para fins de produção. A imagem seguinte mostra o aspeto da configuração do disco entre a unidade de servidor na região de produção do Azure e a região de recuperação após desastre:
Conforme mostrado neste gráfico de descrição geral, terá de encomendar um segundo conjunto de volumes de disco. Os volumes de disco de destino associados ao servidor de Instância Grande do HANA no site de DR têm o mesmo tamanho que os volumes de produção.
Os seguintes volumes são replicados da região de produção para o site de DR:
- /hana/dados
- /hana/logbackups
- /hana/shared (inclui /usr/sap)
O volume /hana/log não é replicado. O registo de transações do SAP HANA não é necessário ao restaurar a partir desses volumes.
Replicação de armazenamento de Instâncias Grandes do HANA
A base da funcionalidade de DR na infraestrutura de Instância Grande do HANA é a replicação de armazenamento. A funcionalidade utilizada no lado do armazenamento não é um fluxo constante de alterações que são replicadas de forma assíncrona à medida que as alterações ocorrem no volume de armazenamento. Em vez disso, é um mecanismo que se baseia na criação de instantâneos destes volumes regularmente. O delta entre um instantâneo já replicado e um novo instantâneo que ainda não está replicado é transferido para o site de DR para volumes de disco de destino. Estes instantâneos são armazenados nos volumes. Se existir uma ativação pós-falha de recuperação após desastre, estes têm de ser restaurados nesses volumes.
A primeira transferência dos dados completos do volume deve ocorrer antes de a quantidade de dados se tornar menor do que os deltas entre instantâneos. Em seguida, os volumes no site de DR irão conter todos os instantâneos de volume tirados no site de produção. Eventualmente, pode utilizar esse sistema de DR para obter um estado anterior para recuperar dados perdidos, sem reverter o sistema de produção.
Se existir uma implementação MCOD com várias instâncias independentes do SAP HANA numa Instância Grande do HANA, todas as instâncias do SAP HANA devem ter o armazenamento replicado para o lado da DR.
Quando utiliza a Replicação do Sistema HANA para elevada disponibilidade no seu site de produção e utiliza a replicação baseada no armazenamento para o site de DR, os volumes de ambos os nós do site primário para a instância de DR são replicados. Compre armazenamento extra (o mesmo tamanho que o nó primário) no site de DR para acomodar a replicação de nós primários e secundários para DR.
Nota
A funcionalidade de replicação de armazenamento de Instâncias Grandes do HANA espelha e replica instantâneos de armazenamento. Se não tirar instantâneos de armazenamento conforme descrito em Cópia de segurança e restauro, não pode haver qualquer replicação para o site de DR. A execução de instantâneos de armazenamento é um pré-requisito para a replicação de armazenamento para o site de recuperação após desastre.
Preparação do cenário de recuperação após desastre
Neste cenário de DR, tem um sistema de produção em execução em Instâncias Grandes do HANA na região de produção do Azure. Para os passos seguintes, digamos que o SID desse sistema HANA é "PRD". Também tem um sistema de não produção em execução em Instâncias Grandes do HANA na região do DR Azure. O SID é "TST". A imagem seguinte mostra esta configuração:
Digamos que a instância do servidor ainda não foi ordenada com o conjunto de volumes de armazenamento extra. Em seguida, o SAP HANA na Gestão de Serviços do Azure anexa os volumes adicionados. São um destino para a réplica de produção para a Instância Grande do HANA na qual está a executar a instância TST HANA. Terá de fornecer o SID da sua instância HANA de produção. Depois de o SAP HANA na Gestão de Serviços do Azure confirmar o anexo desses volumes, terá de montar esses volumes na Instância Grande do HANA.
O próximo passo é instalar a segunda instância do SAP HANA na Instância Grande do HANA na região do DR Azure onde executa a instância TST HANA. A instância sap HANA recentemente instalada tem de ter o mesmo SID. Os utilizadores criados precisam de ter o mesmo UID e ID de Grupo que a instância de produção. Leia Cópia de Segurança e restauro para obter detalhes. Se a instalação for bem-sucedida, terá de:
- Execute o passo 2 da preparação do instantâneo de armazenamento descrito em Cópia de segurança e restauro.
- Crie uma chave pública para a unidade de DR da Instância Grande do HANA, caso ainda não o tenha feito. Veja o passo 3 da preparação do instantâneo de armazenamento descrito em Cópia de segurança e restauro.
- Mantenha o HANABackupCustomerDetails.txt com a nova instância HANA e teste se a conectividade ao armazenamento funciona corretamente.
- Pare a instância do SAP HANA recentemente instalada na Instância Grande do HANA na região do DR Azure.
- Desmonte estes volumes PRD e contacte o SAP HANA na Gestão de Serviços do Azure. Os volumes não podem permanecer montados na unidade porque não podem estar acessíveis enquanto funcionam como o destino de replicação de armazenamento.
A equipa de operações estabelece a relação de replicação entre os volumes prd na região de produção e os volumes PRD na região de DR.
Importante
O volume /hana/log não é replicado porque não é necessário restaurar a base de dados SAP HANA replicada para um estado consistente no site de recuperação após desastre.
Em seguida, defina o agendamento da cópia de segurança de instantâneos de armazenamento para alcançar o RTO e o RPO se ocorrer um desastre. Para minimizar o RPO, defina os seguintes intervalos de replicação no serviço Instância Grande do HANA:
- Para os volumes abrangidos pelo instantâneo combinado (tipo de instantâneo hana), defina para replicar a cada 15 minutos para os destinos de volume de armazenamento equivalentes no local de recuperação após desastre.
- Para o volume de cópia de segurança do registo de transações ( registos de tipo de instantâneo), defina para replicar a cada 3 minutos para os destinos de volume de armazenamento equivalentes no site de recuperação após desastre.
Para minimizar o RPO:
- Tire um instantâneo de armazenamento do tipo hana a cada 30 minutos a 1 hora. Para obter mais informações, veja Fazer cópia de segurança com Aplicação Azure ferramenta Instantâneo Consistente.
- Faça cópias de segurança do registo de transações do SAP HANA a cada 5 minutos.
- Tire um instantâneo de armazenamento de tipo de registo a cada 5 a 15 minutos. Com este período de intervalo, obtém um RPO de cerca de 15 a 25 minutos.
Com esta configuração, a sequência de cópias de segurança do registo de transações, instantâneos de armazenamento e a replicação do volume de cópia de segurança do registo de transações HANA e /hana/data e /hana/shared (inclui /usr/sap) podem ter o aspeto dos dados apresentados neste gráfico:
Para obter um RPO ainda melhor no caso de recuperação após desastre, pode copiar as cópias de segurança do registo de transações HANA do SAP HANA no Azure (Instâncias Grandes) para a outra região do Azure. Para alcançar esta redução adicional do RPO, siga os seguintes passos:
- Faça uma cópia de segurança do registo de transações do HANA com a maior frequência possível para /hana/logbackups.
- Utilize rsync para copiar as cópias de segurança do registo de transações para as máquinas virtuais do Azure alojadas na partilha NFS. As máquinas virtuais (VMs) estão em redes virtuais do Azure na região de produção do Azure e na região de DR. Ligue ambas as redes virtuais do Azure ao circuito que liga as Instâncias Grandes do HANA de produção ao Azure. Para obter mais informações, veja Considerações de rede para a recuperação após desastre com Instâncias Grandes do HANA.
- Mantenha as cópias de segurança do registo de transações na região da VM anexada ao armazenamento exportado NFS.
- Num caso de ativação pós-falha após desastre, complemente as cópias de segurança do registo de transações que encontra no volume /hana/logbackups com cópias de segurança do registo de transações realizadas mais recentemente na partilha NFS no site de DR.
- Inicie uma cópia de segurança do registo de transações para restaurar para a cópia de segurança mais recente que possa ser guardada na região de DR.
Quando as operações da Instância Grande do HANA confirmam a configuração da relação de replicação e inicia as cópias de segurança de instantâneos do armazenamento de execução, a replicação de dados começa.
À medida que a replicação progride, os instantâneos nos volumes prd nas regiões do DR Azure não são restaurados. Os instantâneos só são armazenados. Se os volumes forem montados nesse estado, representam o estado em que desmonta esses volumes após a instalação da instância do PRD SAP HANA no servidor na região do DR Azure. Também representam as cópias de segurança de armazenamento que ainda não foram restauradas.
Se existir uma ativação pós-falha, também pode optar por restaurar para um instantâneo de armazenamento mais antigo em vez de para o instantâneo de armazenamento mais recente.
Passos seguintes
Saiba mais sobre o procedimento de ativação pós-falha de recuperação após desastre.