Переключение при отказе и обратное переключение

Завершено

Azure Site Recovery предоставляет возможность переключиться на Azure в случае возникновения аварии и вернуться на локальные машины после её завершения.

Выполните полное переключение на остальную часть защищенной среды в Azure. После успешного выполнения отработки сценария отказа на одной тестовой виртуальной машине вы выполняете полный отказ. После успешного завершения отработки отказа выполните возврат в исходное состояние.

В этом уроке вы узнаете о различиях между переключением на резерв и возвратом в основном режим работы. Вы также узнаете, как автоматически создать политику восстановления после настройки политики репликации в Azure.

Отказоустойчивость и восстановление после отказа

Переключение на резервный режим — это процесс, который происходит при принятии решения об активации плана BCDR для бизнеса. Отработка отказа происходит, когда текущая динамическая среда, защищенная с помощью Site Recovery, перемещается в среду реплики. Эта реплицированная среда замещает рабочую среду и становится основной инфраструктурой.

Возврат к основной системе — это обратная отработка отказа. Предыдущая динамическая среда (которая теперь является средой реплики, так как отработка отказа произошла) снова возвращает свою исходную роль и снова становится динамической средой. После переключения на резерв в первой инстанции необходимо выполнить процесс повторной защиты. На этом этапе вы синхронизируете исходную среду с новой рабочей средой. Этот процесс позволяет выполнить отработку отказа и возврат к основному узлу без потери данных. Этап повторной защиты, скорее всего, будет длительным процессом, так как необходимо установить, что старая динамическая среда работает правильно после аварии.

Диаграмма, показывающая цикличный характер переключения на резерв, затем возвратного переключения и как работает репликация для повторной защиты виртуальной машины.

Четыре этапа действий отработки отказа и восстановления нормального функционирования:

  • переход на Azure: Если локальный первичный сайт выходит из строя, принимается решение о переходе на Azure (или ваш дополнительный сайт), что создает виртуальные машины из первичных реплицированных данных.
  • повторно защитить виртуальные машины Azure. После завершения аварийного переключения виртуальные машины Azure необходимо повторно защитить, чтобы они могли воспроизвести изменения обратно в локальную среду после устранения сбоя. Виртуальные машины отключены для обеспечения согласованности данных.
  • Возврат в локальную инфраструктуру: Когда локальная площадка снова в рабочем состоянии, возможно вернуть управление в эту среду. Затем она снова становится рабочей средой. Вы не можете переключиться обратно на физические серверы. Все системы должны переключиться обратно на виртуальные машины.
  • повторная защита локальных виртуальных машин: повторная защита локальных виртуальных машин осуществляется для того, чтобы они начали репликацию в Azure после успешного отката к исходному состоянию.

Политики отката

При создании локальной политики репликации для копирования локальных компьютеров в Azure автоматически создается связанная политика обратного восстановления. Политика имеет некоторые фиксированные атрибуты, которые нельзя изменить. Эти атрибуты:

  • Может реплицироваться только на ваш локальный сервер конфигурации.
  • Цель точки восстановления устанавливается в 15 минут.
  • Срок хранения точки восстановления — 24 часа.
  • Моментальные снимки, согласованные с приложениями, создаются каждый час.

Запуск операции отказоустойчивости останавливает виртуальные машины Azure. После завершения репликации запустите локальную виртуальную машину, чтобы взять на себя рабочие нагрузки. Работа службы нарушена, поэтому запланируйте откат на время, которое не повлияет на ваш бизнес.

Планы непрерывности бизнес-процессов и аварийного восстановления

Планы BCDR в Site Recovery позволяют настраивать последовательность отработки отказа и возврата к исходному состоянию для виртуальных машин и приложений, работающих на них. Машины группируются вместе, а действия восстановления можно автоматизировать с помощью скриптов во время аварийного переключения или восстановления. Вы также можете добавить дополнительные шаги вручную для действий, если вам нужно. Если вы протестируете план BCDR до аварии, вы можете быть более уверены в положительном результате. Вам нужно быстро настроить инфраструктуру и запустить ее в дополнительном расположении, чтобы обеспечить соответствие цели времени восстановления компании.

Гибкие резервирования

Благодаря гибкости с отработкой отказа Site Recovery может выполнять отработку отказа по требованию для тестирования. Изоляция этих тестов означает, что активные службы не будут прерваны. Эта гибкость также позволяет выполнять переключение на резервный сервер во время планового отключения активной службы. Сбой не прерывает работу пользователей системы, так как они автоматически переключаются на реплицированную среду. Гибкость работает и в другую сторону. Откат по требованию может быть как частью запланированного теста, так и частью полностью реализованного сценария аварийного восстановления.