Поделиться через


Процедура отработки отказа при аварийном восстановлении

Важно!

Эта статья не заменяет документацию по администрированию SAP HANA или примечания SAP. Предполагается, что вы хорошо понимаете принципы администрирования и эксплуатации SAP HANA, особенно принципы резервного копирования, восстановления, обеспечения высокой доступности и аварийного восстановления. В этой статье показаны снимки экрана из SAP HANA Studio. Содержимое, структура и характер экранов инструментов администрирования SAP и сами инструменты могут изменяться в разных выпусках SAP HANA.

В этой статье мы рассмотрим этапы отработки отказа на сайт аварийного восстановления для SAP HANA на крупных экземплярах Azure (также известной как инфраструктура BareMetal).

Сценарии и варианты отработки отказа

Существует два сценария при отработке отказа на сайт аварийного восстановления:

  • Необходимо восстановить последнее состояние данных базы данных SAP HANA. На этот случай существует сценарий самообслуживания, который позволяет выполнять отработку отказа без необходимости обращения в Майкрософт. Для восстановления размещения нужно обратиться в корпорацию Майкрософт.
  • Требуется выполнить восстановление на основе моментального снимка хранилища, который не является последним реплицированным моментальным снимком. В этом случае следует обратиться в корпорацию Майкрософт.

Примечание

Следующие шаги необходимо выполнить в крупном экземпляре HANA на сайт аварийного восстановления.

Чтобы выполнить восстановление в последние реплицированные моментальные снимки хранилища, выполните действия, описанные в разделе "Выполнение полной отработки отказа с аварийным восстановлением — azure_hana_dr_failover" статьи Средства создания моментальных снимков Майкрософт для SAP HANA в Azure.

Если вы хотите выполнить отработку отказа нескольких экземпляров SAP HANA, выполните команду azure_hana_dr_failover несколько раз. По запросу введите идентификатор безопасности SAP HANA, для которого требуется выполнить отработку отказа и восстановление.

Вы можете проверить отработку отказа при аварийном восстановлении без ущерба для фактической связи репликации. Чтобы выполнить тестовую отработку отказа, выполните действия, описанные в разделе "Выполнение тестовой отработки отказа при аварийном восстановлении — azure_hana_test_dr_failover" статьи о средствах создания моментальных снимков Майкрософт для SAP HANA в Azure.

Важно!

Не запускайте рабочие транзакции в экземпляре, созданном на сайте аварийного восстановления, в процессе тестирования отработки отказа. Команда azure_hana_test_dr_failover создает набор томов, не связанных с основным сайтом. В результате синхронизация с основным сайтом невозможна.

Если вы хотите проверить несколько экземпляров SAP HANA, выполните сценарий несколько раз. По запросу введите идентификатор безопасности экземпляра SAP HANA, для которого требуется протестировать отработку отказа.

Настройка более раннего моментального снимка для томов аварийного восстановления

Предположим, что вам нужно выполнить отработку отказа на сайт аварийного восстановления для восстановления данных, удаленных несколько часов назад, а также задать для томов аварийного восстановления более ранний моментальный снимок. Для этого сделайте следующее:

  1. Завершите работу непроизводственного экземпляра HANA в запущенном крупном экземпляре HANA аварийного восстановления. Неактивный рабочий экземпляр HANA установлен предварительно.

  2. Остановите все процессы SAP HANA. Для этой проверки используйте следующую команду:

    /usr/sap/hostctrl/exe/sapcontrol –nr <HANA instance number> - function GetProcessList.

    В выходных данных должен быть указан остановленный процесс hdbdaemon и должны отсутствовать какие-либо другие работающие или запущенные процессы HANA.

  3. Определите имя моментального снимка или идентификатор резервного копирования SAP HANA для восстановления на сайте аварийного восстановления. В реальных ситуациях аварийного восстановления, как правило, это последний моментальный снимок. Если необходимо восстановить потерянные данные, выберите более ранний снимок.

  4. Обратитесь в службу поддержки Azure, отправив запрос на техническую поддержку с высоким приоритетом. Запросите восстановление этого моментального снимка, указав его имя и дату создания. Его также можно определить по идентификатору резервного копирования HANA на сайте аварийного восстановления. Если этого не сделать, отдел эксплуатации по умолчанию восстановит только том /hana/data. Если вы хотите также восстановить тома /hana/logbackups, вам необходимо обозначить это в запросе. Не восстанавливайте том /hana/shared. Вместо этого после повторного подключения тома /hana/shared для PRD выберите определенные файлы, такие как global.ini, из каталога .snapshot и его подкаталогов.

    Рабочая группа Майкрософт выполнит следующие действия:

    а. Остановка репликации моментальных снимков из рабочего тома на тома аварийного восстановления. Прерывание уже могло произойти и ранее, если из-за сбоя на рабочем сайте произошла авария.

    b. Восстановление имени моментального снимка или моментального снимка с идентификатором резервного копирования, выбранным в томах аварийного восстановления.

После завершения восстановления тома аварийного восстановления становятся доступными для подключения к крупным экземплярам HANA в регионе аварийного восстановления.

  1. Подключите тома аварийного восстановления к единице крупного экземпляра HANA на сайте аварийного восстановления.
  2. Запустите неактивный рабочий экземпляр SAP HANA.
  3. Предположим, вы решили скопировать журналы резервных копий журналов транзакций, чтобы сократить время целевой точки восстановления. Затем объедините резервные копии журнала транзакций во вновь подключенный каталог аварийного восстановления /hana/logbackups. Не перезаписывайте имеющиеся резервные копии. Скопируйте новые резервные копии, которые еще не были реплицированы.
  4. Кроме того, можно восстановить отдельные файлы из моментальных снимков, которые не были реплицированы в том /hana/shared/PRD в регионе аварийного восстановления Azure.

Восстановление производственного экземпляра SAP HANA

Ниже приведены действия по восстановлению производственного экземпляра SAP HANA из восстановленного моментального снимка хранилища и доступных резервных копий журналов транзакций.

  1. С помощью SAP HANA Studio измените расположение резервной копии на расположение /hana/logbackups.

    Изменение расположения резервной копии для аварийного восстановления

  2. SAP HANA проверит расположения файлов резервных копий и предложит для восстановления самую последнюю резервную копию журналов транзакций. Проверка может занять несколько минут, после чего отобразится следующий экран:

    Список резервных копий журналов транзакций для аварийного восстановления

  3. Настройте некоторые параметры по умолчанию:

    • снимите флажок Use Delta Backups (Использовать разностные резервные копии);
    • установите флажок Initialize Log Area (Инициализировать область журнала).

    Выбор инициализации области журнала

  4. Нажмите кнопку Завершить.

    Завершение аварийного восстановления

Должно появиться окно хода выполнения, как показано ниже. Помните, что в примере выполняется аварийное восстановление развернутой конфигурации SAP HANA с тремя узлами.

Ход восстановления

Если восстановление на завершающем экране остановилось и не отображается на экране хода выполнения, проверьте, все ли экземпляры SAP HANA выполняются в рабочих узлах. При необходимости запустите экземпляры SAP HANA вручную.

Восстановление размещения с сайта аварийного восстановления на рабочий сайт

Вы можете выполнить восстановление размещения с сайта аварийного восстановления на рабочий сайт. Рассмотрим сценарий, когда отработка отказа на сайт аварийного восстановления была вызвана проблемами в рабочем регионе Azure, а не необходимостью восстановить потерянные данные.

Некоторое время на сайте аварийного восстановления выполнялась рабочая нагрузка SAP. После устранения проблем на рабочем сайте можно выполнить восстановление размещения. Так как потеря данных недопустима, возвращение на рабочий сайт включает в себя несколько действий и тесное взаимодействие с рабочей группой SAP HANA в Azure. Вы должны связаться с рабочей группой, чтобы она инициировала синхронизацию на рабочий сайт после устранения проблем.

Выполните следующие действия.

  1. Рабочая группа SAP HANA в Azure получает триггер для синхронизации томов рабочего хранилища из томов хранилища аварийного восстановления, которые теперь представляют рабочее состояние. В этом состоянии работа крупного экземпляра HANA на рабочем сайте завершена.
  2. Рабочая группа SAP HANA в Azure отслеживает репликацию и обеспечивает актуальность данных, а затем информирует клиентов.
  3. Вам необходимо завершить работу приложений, которые используют рабочий экземпляр HANA на сайте аварийного восстановления. Затем создайте резервную копию журналов транзакций HANA. После этого остановите экземпляр HANA, запущенный в крупном экземпляре HANA на сайте аварийного восстановления.
  4. Теперь рабочая группа снова вручную синхронизирует тома дисков.
  5. Рабочая группа SAP HANA в Azure снова запускает крупный экземпляр HANA на рабочем сайте, а затем передает ее вам. Убедитесь в том, что в момент запуска крупного экземпляра HANA работа экземпляра SAP HANA завершена.
  6. Выполните те же действия по восстановлению базы данных, которые вы выполняли ранее при отработке отказа на сайт аварийного восстановления.

Мониторинг репликации для аварийного восстановления

Чтобы наблюдать за состоянием процесса репликации хранилища, выполните скрипт azure_hana_replication_status. Эту команду нужно выполнить в единице, работающей в расположении аварийного восстановления. В противном случае она не будет работать должным образом. Эта команда работает независимо от того, активна ли репликация. Команда может выполняться для каждого крупного экземпляра HANA вашего клиента в расположении аварийного восстановления. С ее помощью невозможно получить сведения о загрузочном томе.

Дополнительные сведения об этой команде и ее выходных данных см. в разделе "Получение состояния репликации с аварийным восстановлением — azure_hana_replication_status" статьи Средства создания моментальных снимков Майкрософт для SAP HANA в Azure.

Дальнейшие действия

Узнайте больше о мониторинге SAP HANA (крупные экземпляры) в Azure.