Поделиться через


Архитектура аварийного восстановления VMware в Azure — обновлена

В этой статье описывается архитектура и процессы, используемые при развертывании репликации аварийного восстановления, отработки отказа и восстановления виртуальных машин VMware между локальным сайтом VMware и Azure с помощью средства защиты модернизированных виртуальных машин VMware или физической машины.

Примечание.

Убедитесь, что вы создадите хранилище служб восстановления для настройки устройства репликации ASR. Не используйте существующее хранилище.

Сведения об архитектуре Azure Site Recovery в классической архитектуре см. в этой статье.

Компоненты архитектуры

Приведенные ниже таблица и рисунки позволяют получить общее представление о компонентах, используемых для аварийного восстановления виртуальных/физических машин VMware в Azure.

Архитектура

Компонент Требование Сведения
Azure Подписка Azure, учетная запись хранения Azure для кэша, управляемый диск и сеть Azure. Реплицированные данные из локальных виртуальных машин хранятся в учетной записи хранения. Виртуальные машины Azure создаются с использованием реплицированных данных при запуске отработки отказа из локальной среды в Azure. При создании виртуальные машины Azure подключаются к виртуальной сети Azure.
Устройство репликации Azure Site Recovery Это основной строительным блоком всей локальной инфраструктуры Azure Site Recovery.

Все компоненты устройства координируются с помощью устройства репликации. Эта служба контролирует все сквозные действия Site Recovery, включая мониторинг работоспособности защищенных компьютеров, репликацию данных, автоматическое обновление и т. д.
На устройстве размещаются различные ключевые компоненты, такие как:

Прокси-сервер: этот компонент выступает в качестве прокси-канала между агентом мобильности и службами Site Recovery в облаке. Это гарантирует отсутствие других подключений к Интернету, необходимых для рабочих нагрузок для создания точек восстановления.

Обнаруженные элементы. Этот компонент собирает сведения о vCenter и координируется со службой управления Azure Site Recovery в облаке.

Сервер повторной защиты.Этот компонент координируется с машинами Azure и локальными компьютерами во время операций повторной защиты и восстановления размещения.

Сервер обработки: этот компонент используется для кэширования, сжатия данных перед отправкой в Azure.

Дополнительные сведения об устройстве репликации и об использовании нескольких устройств репликации.

Агент службы восстановления: этот компонент используется для настройки и регистрации в службах Site Recovery и для мониторинга работоспособности всех компонентов.

Поставщик Site Recovery: этот компонент используется для упрощения повторной защиты. Он определяет между альтернативным расположением повторной защиты и повторной защитой исходного расположения для исходного компьютера.

Служба репликации. Этот компонент используется для репликации данных из исходного расположения в Azure.
Серверы VMware Виртуальные машины VMware размещаются на локальных серверах vSphere ESXi. Мы рекомендуем управлять узлами с помощью сервера vCenter. При развертывании Site Recovery добавьте серверы VMware в хранилище служб восстановления.
Реплицируемые компьютеры Служба Mobility Service устанавливается на каждой реплицируемой виртуальной машине VMware. Рекомендуется разрешить автоматическую установку службы Mobility Service. Кроме того, можно установить эту службу вручную.

Настройка исходящих сетевых подключений

Чтобы служба Site Recovery работала должным образом, необходимо модифицировать исходящее сетевое подключение, так, чтобы оно позволило вашей среде делать репликацию.

Примечание.

Site Recovery не поддерживает использование прокси-сервер проверки подлинности для управления сетевым подключением.

Исходящие подключения для URL-адресов

При использовании прокси-сервера или брандмауэра на основе URL-адресов для управления исходящими подключениями разрешите использование этих URL-адресов:

URL-адрес Сведения
portal.azure.com Перейдите на портал Azure.
*.windows.net
*.msftauth.net
*.msauth.net
*.microsoft.com
*.live.com
*.office.com
Чтобы войти в вашу подписку Azure.
*.microsoftonline.com Создайте приложения Microsoft Entra для устройства для взаимодействия с Azure Site Recovery.
management.azure.com Создайте приложения Microsoft Entra для устройства для взаимодействия со службой Azure Site Recovery.
*.services.visualstudio.com Передача журналов приложений, используемых для внутреннего мониторинга.
*.vault.azure.net Управление секретами в Azure Key Vault. Примечание. Убедитесь, что для репликации компьютеров есть доступ к этому.
aka.ms Разрешить доступ к ссылкам ,также известным как". Используется для обновлений устройства Azure Site Recovery.
download.microsoft.com/download Разрешение скачивания из Центра загрузки Майкрософт.
*.servicebus.windows.net Обмен данными между устройством и службой Azure Site Recovery.
*.discoverysrv.windowsazure.com Подключение к URL-адресу службы обнаружения Azure Site Recovery.
*.hypervrecoverymanager.windowsazure.com Подключение к URL-адресам микрослужбы Azure Site Recovery.
*.blob.core.windows.net Отправьте данные в хранилище Azure, которое используется для создания целевых дисков.
*.backup.windowsazure.com URL-адрес службы защиты — микрослужба, используемая Azure Site Recovery для обработки и создания реплицированных дисков в Azure.
*.prod.migration.windowsazure.com Чтобы обнаружить локальное имущество.

Процесс репликации

  1. При включении репликации для виртуальной машины начинается начальная репликация в службу хранилища Azure с помощью указанной политики репликации. Обратите внимание на следующее:

    • Для виртуальных машин VMware репликации осуществляются на уровне блока почти непрерывно с помощью агента Mobility Service на виртуальной машине.
    • Применяются все параметры политики репликации:
      • Пороговое значение RPO. Этот параметр не влияет на репликацию. Он помогает с мониторингом. Будет создано событие, возможно, с отправкой сообщения электронной почты, если текущее значение RPO превышает заданное вами пороговое значение.
      • Хранение точки восстановления. Этот параметр указывает, на какой период в прошлом вы хотите вернуться в случае нарушения работы. Максимальный срок хранения — 15 дней.
      • Согласованные с приложением моментальные снимки. Моментальный снимок, согласованный с приложением, может создаваться с интервалом от 1 до 12 часов в зависимости от потребностей приложения. Это стандартные моментальные снимки BLOB-объектов Azure. Агент службы Mobility, запущенный на виртуальной машине, запрашивает моментальный снимок VSS в соответствии с этим параметром и отмечает этот момент времени как точку согласованности приложения в потоке репликации.

      Примечание.

      Большой период хранения точки восстановления может повлиять на стоимость хранения, так как может потребоваться сохранить дополнительные точки восстановления.

  2. Трафик реплицируется в общедоступные конечные точки службы хранилища Azure через Интернет. Кроме того, можно использовать Azure ExpressRoute со службой Пиринг Microsoft . Репликация трафика через виртуальную частную сеть типа "сеть — сеть" (VPN) из локального сайта в Azure поддерживается только при использовании частных конечных точек.

  3. Начальная репликация обеспечивает, чтобы все данные на компьютере во время включения репликации отправлялись в Azure. После завершения начальной репликации начинается репликация разностных изменений в Azure. Отслеживаемые изменения для машины отправляются на сервер обработки.

  4. Обмен данными происходит следующим образом.

    • Виртуальные машины обмениваются данными с локальным устройством через порт HTTPS 443 для входящих подключений, чтобы управлять репликацией.
    • Виртуальные машины отправляют данные репликации на устройство через порт HTTPS 9443. Этот порт можно изменить.
    • Устройство получает данные репликации, оптимизирует и шифрует его и отправляет его в хранилище Azure через исходящий порт 443.
  5. Сначала журналы данных репликации помещаются в учетную запись хранения кэша в Azure. Эти журналы обрабатываются и данные хранятся на управляемом диске Azure (называемом asrseeddisk). На этом диске создаются точки восстановления.

Поток данных VMware в Azure с портами

Процедура повторной синхронизации

  1. Иногда во время начальной репликации или при передаче разностных изменений могут возникнуть проблемы с сетевым подключением между исходным компьютером и сервером обработки или между сервером обработки и Azure. Любая из них может привести к сбоям при мгновенной передаче данных в Azure.
  2. Чтобы избежать проблем с целостностью данных и снизить затраты на их передачу, Site Recovery помечает компьютер для повторной синхронизации.
  3. Компьютер также можно пометить для повторной синхронизации в таких ситуациях, как показано ниже, чтобы обеспечить согласованность между исходным компьютером и данными, хранящимися в Azure.
    • Если компьютер проходит принудительное завершение работы
    • Если компьютер проходит процесс изменения в конфигурации, например изменение размера диска (размер диска изменяется с 2 ТБ на 4 ТБ)
  4. Повторная синхронизация отправляет в Azure только разностные данные. Обмен данными между локальной средой и Azure путем сворачивания контрольных сумм данных между исходным компьютером и данными, хранящимися в Azure.
  5. По умолчанию повторная синхронизация автоматически выполняется в нерабочее время. Если вы не хотите ждать времени повторной синхронизации по умолчанию, то можете повторно синхронизировать виртуальную машину вручную. Для этого на портале Azure выберите виртуальную машину и щелкните >Повторная синхронизация.
  6. Если повторная синхронизация, установленная по умолчанию, завершается сбоем в нерабочее время и требуется вмешательство вручную, то на определенном компьютере в портале Azure возникает ошибка. Вы можете устранить эту ошибку и запустить повторную синхронизацию вручную.
  7. После завершения повторной синхронизации будет возобновлена репликация разностных изменений.

Политика репликации

По умолчанию при включении репликации виртуальной машины Azure Site Recovery создает политику репликации, стандартные параметры которой представлены в следующей таблице.

Параметр политики Сведения По умолчанию
Хранение точки восстановления Указывает, как долго в Site Recovery хранятся точки восстановления. 1 день
Периодичность создания моментальных снимков с согласованием приложений Как часто Site Recovery принимает моментальный снимок, согласованный с приложением Выключено

Управление политиками репликации

Вы можете выполнять следующие действия для изменения заданных по умолчанию параметров политик репликации и управления ими.

  • Можно изменять параметры при включении репликации.
  • При попытке включить репликацию можно создать или изменить новую политику репликации.

Согласованность нескольких виртуальных машин

Если вы хотите, чтобы виртуальные машины реплицировались вместе и имели общие точки восстановления, согласованные с сбоями и приложениями при отработки отказа, их можно объединить в группу репликации. Согласованность нескольких виртуальных машин влияет на производительность рабочей нагрузки и должна использоваться только для рабочих нагрузок 4, требующих согласованности на всех компьютерах.

Моментальные снимки и точки восстановления

Точки восстановления создаются на основе моментальных снимков дисков виртуальной машины, сделанных в определенный момент времени. При отработке отказа виртуальной машины эти точки восстановления используются для восстановления виртуальной машины в целевом расположении.

Обычно при отработке отказа важно, чтобы виртуальная машина запускалась без повреждения или потери данных и чтобы данные на этой виртуальной машине сохраняли согласованность на уровне операционной системы и выполняемых приложений. Это зависит от типа создаваемых моментальных снимков.

Site Recovery создает моментальные снимки следующим образом.

  1. Site Recovery по умолчанию создает моментальные снимки данных без учета состояния приложений, а также моментальные снимки, согласованные на уровне приложений, если вы укажете для них частоту создания.
  2. Точки восстановления создаются из моментальных снимков и хранятся в соответствии с параметрами хранения в политике репликации.

Согласованность

В следующей таблице описываются различные виды согласованности.

Без учета состояния приложений

Description Сведения Рекомендация
Моментальный снимок без учета состояния приложения содержит все данные, которые были записаны на диск в момент создания этого моментального снимка. Он не содержит никакой информации из памяти компьютера.

Он сохраняет данные точно так же, как если бы в момент создания моментального снимка произошел сбой виртуальной машины или отключение питания сервера.

Моментальный снимок без учета состояния не гарантирует согласованность данных для операционной системы или приложений этой виртуальной машины.
По умолчанию Site Recovery создает точки восстановления без учета состояния приложений каждые пять минут. Этот параметр нельзя изменять.

Сейчас большинство приложений успешно восстанавливаются по точкам восстановления без учета состояния.

Точек восстановления без учета состояния приложений обычно вполне достаточно для репликации операционных систем и приложений, таких как DHCP-серверы и серверы печати.

согласованность на уровне приложений

Description Сведения Рекомендация
Точки восстановления с согласованностью на уровне приложений создаются на основе моментальных снимков с согласованностью на уровне приложений.

Моментальный снимок, согласованный с приложением, содержит все сведения в моментальном снимке, а также все данные в памяти и транзакциях.
Моментальные снимки с согласованностью на уровне приложений создаются с помощью службы теневого копирования томов (VSS).

1) Azure Site Recovery использует метод резервного копирования только копирования (VSS_BT_COPY), который не изменяет время резервного копирования журнала транзакций Microsoft SQL и номер последовательности

2). При запуске моментального снимка VSS выполняет операцию копирования по записи (COW) на томе.

3) Перед этой операцией VSS сообщает каждому приложению на компьютере, что все данные из оперативной памяти необходимо передать на диск.

4) VSS предоставляет приложению резервного копирования и аварийного восстановления (в нашем примере это Site Recovery) возможность считать данные моментального снимка и продолжить работу.
Вы можете указать частоту создания моментальных снимков с согласованностью на уровне приложений. Эта частота должна быть меньше, чем период хранения точек восстановления. Например, если для хранения точек восстановления используется значение по умолчанию 24 часа, настройте частоту создания с интервалом менее 24 часов.

Такие моментальные снимки более сложны и требуют больше времени на создание, чем моментальные снимки без учета состояния приложений.

Они снижают производительность приложений, которые выполняются на реплицируемой виртуальной машине.

Процесс отработки отказа и восстановления размещения

После настройки репликации выполняется детализация аварийного восстановления (тестовая отработка отказа), чтобы убедиться, что все работает должным образом, можно выполнить отработку отказа и восстановление размещения по мере необходимости.

  1. Можно выполнять отработку отказа отдельных компьютеров или создать планы восстановления, чтобы выполнять отработку отказа сразу нескольких виртуальных машин. План восстановления имеет следующие преимущества перед отработкой отказа отельных компьютеров:

    • Можно моделировать зависимости приложений, включив все виртуальные машины для приложения в один план восстановления.
    • Можно добавить сценарии, модули runbook Azure и паузу для действий, выполняемых вручную.
  2. После активации начальной отработки отказа выполняется ее фиксация для получения доступа к рабочей нагрузке из виртуальной машины Azure.

  3. Когда основной локальный сайт снова станет доступным, можно будет подготовить среду к восстановлению размещения. Если необходимо восстановить размещение больших объемов трафика, настройте новое устройство репликации Azure Site Recovery.

    • Этап 1. Повторно включите защиту виртуальных машин Azure, чтобы обеспечить их репликацию из Azure в локальные виртуальные машины VMware.
    • Этап 2. Запустите отработку отказа на локальном сайте.
    • Этап 3. После восстановления размещения рабочих нагрузок повторно включите репликацию для локальных виртуальных машин.

Следующие шаги

Ознакомьтесь с этим учебником, чтобы включить репликацию из VMware в Azure.