Отработка отказа и восстановление размещения с помощью Azure Site Recovery

Завершено

Azure Site Recovery позволяет вашей организации иметь гибкость, либо вручную выполнить отработку отказа в дополнительный регион Azure, либо выполнить отработку отказа на исходную виртуальную машину. Управлять этим проще всего вручную на портале Azure. У вас есть другие варианты включения автоматизации, если вашей организации требуется автоматизировать активацию отработки отказа. К этим параметрам относятся такие технологии, как скрипты с помощью PowerShell или настройка модулей Runbook в служба автоматизации Azure для оркестрации отработки отказа.

Выполните следующие действия, чтобы выполнить полную отработку отказа защищенной виртуальной машины в дополнительный регион в подписке. После успешного завершения отработки отказа вы восстановите размещение этой виртуальной машины.

В этом уроке вы узнаете об отработке отказа и восстановлении размещения, о повторной защите виртуальной машины после отработки отказа и об отслеживании состояния повторной защиты.

Что такое отработка отказа?

Схема, показывающая недоступный исходный регион и новую целевую среду, куда выполняется отработка отказа.

Отработка отказа происходит при принятии решения о выполнении плана аварийного восстановления для вашей организации. Существующая рабочая среда, защищенная Site Recovery, реплицируется в другой регион. Целевая среда становится де-факто рабочей средой и становится средой, в которой выполняются производственные службы вашей организации. Когда целевой регион становится активным, использование исходной среды должно быть прекращено. Для этого вам нужно остановить исходные виртуальные машины.

Отключение исходных виртуальных машин дает и другое преимущество. Использование завершившей работу виртуальной машины обеспечивает минимальную потерю данных, так как Site Recovery ожидает запись всех данных на диск, прежде чем активировать отработку отказа. Чтобы использовать эти данные и получить наименьшую возможную RPO, мы выбираем точку восстановления Последняя (наименьшее значение RPO).

Снимок экрана: параметры отработки отказа.

Что такое повторное защита и почему это важно?

При отработки отказа виртуальной машины репликация Site Recovery больше не активна. Чтобы защитить виртуальную машину после отработки отказа, требуется повторно включить защиту. Так как у вас уже есть инфраструктура в другом регионе, вы можете запустить репликацию обратно в исходный регион. Повторная защита позволяет Site Recovery начать репликацию новой целевой среды в исходную среду, с которой все начиналось.

Вы можете использовать гибкость отработки отказа отдельных виртуальных машин или отработку отказа с помощью плана восстановления для повторной защиты инфраструктуры отработки отказа. Вы можете повторно защитить каждую виртуальную машину в отдельности или защитить несколько виртуальных машин с помощью плана восстановления.

Повторная защита занимает от 45 минут до 2 часов в зависимости от размера и типа виртуальной машины. В отличие от других процессов Site Recovery, которые можно отслеживать, просматривая ход выполнения задания, необходимо просмотреть ход выполнения повторной защиты на уровне виртуальной машины. Это требование обусловлено тем, что фаза синхронизации не указана как задание восстановления сайта.

На изображении показано состояние защищенного элемента с выделенным процентом синхронизации.

Снимок экрана: состояние виртуальной машины записей пациентов с выделенным процентом синхронизации.

Что такое восстановление размещения?

Восстановление размещения — это операция, обратная отработке отказа. Это ситуация, когда завершенная отработка отказа в дополнительный регион зафиксирована и теперь является рабочей средой. Для среды, для которой выполнена отработка отказа, реализована повторная защита, а исходная среда теперь является репликой. В сценарии восстановления размещения Site Recovery выполняет отработку отказа обратно на исходные виртуальные машины.

Процесс восстановления размещения аналогичен процессу отработки отказа, даже в отношении повторного использования плана восстановления. При выборе отработки отказа в плане восстановления в поле из указан целевой регион, а в поле в задан исходный регион.

Управление отработкой отказа

Site Recovery может выполнять отработку отказа по запросу. Тестовые отработки отказа изолированы, то есть не влияют на рабочие службы. Эта гибкость позволяет запускать отработку отказа без прерывания работы пользователей этой системы. Она также позволяет выполнять восстановление размещения по запросу в рамках запланированного теста или в составе полноценной процедуры аварийного восстановления.

Планы восстановления в Site Recovery также позволяют настраивать и последовательно выполнять отработку отказа и восстановление размещения. Планы позволяют группировать компьютеры и рабочие нагрузки.

Гибкость может проявляться и в том, как активируется процесс отработки отказа. Ручную отработку отказа легко выполнить с помощью портала Azure. Написание сценариев PowerShell или использование runbook в службе автоматизации Azure также позволяют применять различные возможности автоматизации.

Устранение проблем с отработкой отказа

Хотя служба Site Recovery автоматизирована, ошибки все равно могут возникать. Ниже перечислены три наиболее распространенные проблемы. Полный список проблем и способы их устранения см. по ссылке в разделе Сводка.

Проблемы с квотами ресурсов Azure

Site Recovery требуется создать ресурсы в разных регионах. Если наша подписка не позволяет это сделать, происходит сбой репликации. Эта ошибка также возникает, если у нашей подписки нет подходящих квот на создание виртуальных машин, соответствующих размеру исходных виртуальных машин.

Это можно исправить, обратившись в службу поддержки выставления счетов Azure и запросив, что они создают правильные виртуальные машины размера в нужном целевом регионе.

Некоторые диски доступны для защиты

Эта ошибка возникает, если вы завершили настройку Site Recovery для виртуальных машин и впоследствии добавили или инициализировали дополнительные диски.

Чтобы устранить эту ошибку, можно добавить репликацию для вновь добавленных дисков или пропустить предупреждение о дисках.

Доверенные корневые сертификаты

Убедитесь, что установлены актуальные корневые сертификаты, позволяющие Site Recovery безопасно обмениваться данными и проверять подлинность виртуальных машин для репликации. Эта ошибка может появиться, если для виртуальных машин не установлены последние обновления. Прежде чем Site Recovery сможет включить репликацию, необходимо обновить виртуальные машины Windows и Linux.

Исправление различается в зависимости от операционной системы. Windows так же просто, как обеспечение включения автоматического обновления Windows и применения обновлений. Для каждого дистрибутива Linux необходимо следовать инструкциям его создателя.