Поделиться через


Непрерывность бизнес-процессов и аварийное восстановление для Решения Azure VMware

Этот сценарий корпоративного масштаба помогает улучшить непрерывность бизнес-процессов и аварийное восстановление (BCDR). Решение Azure VMware предлагает частные облака, содержащие кластеры VMware vSphere, построенные на выделенной инфраструктуре Azure без виртуализации. Решение предоставляет не менее трех узлов ESXi, до 16 узлов на кластер. Все подготовленные частные облака имеют VMware vCenter Server, VMware vSAN, VMware vSphere и VMware NSX-T Data Center. Сведения о соглашении об уровне обслуживания (SLA) для Решение Azure VMware см. в разделе об уровне обслуживания для Решение Azure VMware.

Независимо от того, есть ли у вас локальная среда или Решение Azure VMware, следует учитывать различные факторы BCDR для подготовки к аварии. Надежный план BCDR направлен на защиту компании от потери данных, финансовой потери и простоя при возникновении разрушительных событий. В следующем дереве принятия решений показаны различные варианты BCDR, доступные для Решение Azure VMware.

Схема с блок-диаграммой для обеспечения непрерывности бизнес-процессов и аварийного восстановления.

Примечание.

Пилотная среда настраивается с минимальной конфигурацией и основными компонентами для поддержки критического набора приложений. Однако он может масштабироваться и добавлять больше узлов, чтобы принять большую часть нагрузки в случае отказа. Для аварийного восстановления рабочих нагрузок решения Azure VMware, требовательных к вычислительным ресурсам и памяти, на дополнительном сайте требуется такое же количество хранилища.

Рекомендации по обеспечению непрерывности бизнес-процессов при проектировании

  • Политики хранилища vSAN VMware в Решении Azure VMware реализуются с учетом доступности хранилища. Если кластер имеет от трех до пяти узлов, количество сбоев узлов, которые могут быть разрешены без потери данных, равно одному. Если кластер содержит от шести до шестнадцати узлов, то число узлов, на которых может возникнуть сбой без последующей потери данных, равно двум. Политики хранилища vSAN VMware можно применять к отдельным виртуальным машинам. Хотя эти политики являются стандартными, вы можете изменить политику в соответствии с пользовательскими требованиями. Дополнительные сведения см. в разделе Концепции хранилища для Решения Azure VMware.

  • Высокий уровень доступности vSphere включен по умолчанию в Решение Azure VMware. Политика обеспечения высокой доступности резервирует вычислительные ресурсы и емкость памяти для одного узла. Это резервирование обеспечивает достаточную емкость для перезапуска рабочих нагрузок в другом узле в кластере Решение Azure VMware.

  • Высокий уровень доступности с растянутыми кластерами: при использовании Решение Azure VMware узлы ESXi, развернутые в стандартном кластере vSphere, традиционно находятся в одной зоне доступности Azure и защищены высокой доступностью vSphere. Однако рабочие нагрузки не защищены от сбоя зоны доступности. Чтобы защититься от сбоя, один кластер vSAN может охватывать две отдельные зоны доступности, называемые растянутыми кластерами vSAN. Дополнительные сведения см. в статье "Развертывание растянутых кластеров vSAN".

  • Выберите проверенное решение для резервного копирования виртуальных машин VMware vSphere, таких как Microsoft Azure Backup Server или решение партнера для резервного копирования.

  • Сведения о поддерживаемых функциях в решениях резервного копирования партнеров см. в соответствующей документации партнера.

    Примечание.

    Решение Azure VMware конфигурации частного облака vCenter Server и HCX Manager (если включена) находятся в ежедневном расписании резервного копирования, а конфигурация NSX находится в расписании почасового резервного копирования. Резервные копии сохраняются не менее трех дней.

  • Решение Azure VMware компоненты, такие как vCenter Server, NSX-T Manager или HCX Manager, являются управляемыми службами, для которых Azure управляет резервным копированием. Чтобы восстановить резервную копию, создайте запрос в службу поддержки Azure.

Рекомендации по обеспечению непрерывности бизнес-процессов при проектировании

  • Используйте Azure Backup Server для резервного копирования частного облака в Azure VMware Solution. Дополнительные сведения см. в статье Резервное копирование виртуальных машин VMware vSphere с помощью Azure Backup. Поддерживаемые топологии развертывания включают агент MARS и диспетчер защиты данных. Каждая топология развертывания имеет собственную матрицу поддержки, ограничения и лимитации.

  • Разверните Azure Backup Server в том же регионе Azure, что и частное облако Решения Azure VMware. Этот метод развертывания сокращает затраты на трафик, упрощает администрирование и позволяет сохранить основную и дополнительную топологию. Ознакомьтесь с руководством по выбору регионов Azure для рекомендаций по развертыванию регионов Azure.

  • Azure Backup можно развернуть в виде виртуальной машины (IaaS) в инфраструктуре как услуга Azure или в частном облаке Azure VMware Solution. Настоятельно рекомендуется развернуть его за пределами частного облака Azure VMware Solution. Разверните резервную копию в виртуальной сети Azure и убедитесь, что эта виртуальная сеть подключена к той же ExpressRoute, которая подключена к частному облаку Решение Azure VMware. Запуск резервного сервера за пределами частного облака Azure VMware Solution помогает сократить потребление vSAN, так как vSAN является ресурсом с ограниченной емкостью в частном облаке Azure VMware Solution.

    Azure Backup Server, развернутый как виртуальная машина IaaS Azure.

    Схема, демонстрирующая развертывание Azure Backup Server в качестве виртуальной машины IaaS Azure.

    Azure Backup Server, развернутый как виртуальная машина решения Azure VMware.

    Схема, демонстрирующая развертывание Azure Backup Server в качестве виртуальной машины решения Azure VMware.

  • Используйте контрольный список требований к производительности приложения, чтобы получить правильный тип емкости и диска, например HDD, SSD или Ultra. Рассмотрим номер SKU виртуальной машины IaaS Azure, поддерживающий тип диска и емкость для операций резервного копирования.

  • Используйте планировщик емкости Azure Backup Server для определения количества серверов, объема хранилища и требований IOPS (операций ввода-вывода в секунду) для каждого из них. При предоставлении значения "Общий размер рабочей нагрузки (ГБ)*" в планировщике емкости используйте медиановое значение между "используемым хранилищем" и "выделенным хранилищем" всех виртуальных машин в vCenter, которые требуется создать резервную копию.

  • Используйте пулы хранения с Azure Backup Server для повышения IOPS и пропускной способности диска. Используйте многоуровневое хранилище на Backup Server для расширенных операций. Установите для параметра DisableWriteAutoTiering значение конфигурации 1 на томе MABS, чтобы весь уровень производительности был доступен для хранения метаданных ReFS.

  • Определите количество параллельных заданий резервного копирования и операций восстановления, выполняемых на сервере Azure Backup. В настоящее время поддерживаются восемь параллельных заданий резервного копирования. Измеряйте время, затраченное на резервное копирование и восстановление критически важных рабочих нагрузок на нескольких запусках. Убедитесь, что время резервного копирования и восстановления соответствует требованиям RPO и RTO для сервера Azure Backup. Убедитесь, что хранилище данных AVS vSAN имеет достаточную емкость для хранения восстановленной резервной копии.

  • Добавьте необходимые исключения антивирусной программы для файлов и папок Azure Backup Server, как описано здесь , если на Сервере Azure Backup Server запущено какое-либо антивирусное или антивредоносное программное обеспечение. При использовании агента защиты DPM на любой виртуальной машине Azure VMware Solution для резервного копирования приложений (например, SQL, Sharepoint и т. д.) отключите мониторинг dpmra.exe в режиме реального времени.

  • Настройте соответствующие правила NSG (группа безопасности сети) в подсети, где размещен Azure Backup Server, чтобы разрешить сетевое взаимодействие с агентом защиты DPM, работающим на защищенной виртуальной машине в Решение Azure VMware. Агент защиты DPM взаимодействует с Azure Backup Server на любом динамическом порту от 1024 до 65535.

  • В настоящее время Azure Backup Server не поддерживает кросс-региональное восстановление для частного облака Azure VMware Solution. ** Обратитесь к решениям партнеров по резервному копированию и к разделу аварийного восстановления, если требуется межрегиональное восстановление с помощью решения Azure VMware.

Рекомендации по обеспечению аварийного восстановления при проектировании

  • Выравнивайте бизнес-требования с целями времени восстановления (RTO), емкостью и целями точки восстановления (RPO) для приложений. Планируйте и разрабатывайте в соответствии с достижением этих целей, используя наиболее подходящую технологию репликации. Например, нативно реплицируйте базы данных SQL с помощью группы доступности SQL Always On или используйте инструмент аварийного восстановления, например VMware Site Recovery Manager.

  • Определите целевой сайт аварийного восстановления для защищённого частного облака Azure VMware Solution. Этот сайт определяет, какие средства аварийного восстановления подходят для среды. Например, если вы хотите восстановить рабочие нагрузки Azure VMware Solution в собственные виртуальные машины IaaS Azure, можно рассмотреть использование Azure Site Recovery или Zerto.

  • Определите, какое подмножество рабочих нагрузок решения Azure VMware требует защиты в случае аварийного восстановления. Рассмотрите возможность классификации рабочих нагрузок на основе приоритета: P0 для критически важных для бизнеса рабочих нагрузок, а также P1, P2, P3 для других рабочих нагрузок, которые важны, но не столь важны для работы бизнеса. План непрерывности бизнес-процессов клиента определяет уровни приоритета, которые помогают контролировать затраты, связанные с реализацией аварийного восстановления.

  • В большинстве случаев непроизводственные среды, такие как разработка, тестирование или UAT, не требуют переключения на вторичный сайт. Чтобы сэкономить на затратах, на вторичном объекте запустить запасное освещение с уменьшенной производственной мощностью и для критически важных задач. Для увеличения емкости можно увеличить масштаб, чтобы добавить узлы ESXi в кластер во время события аварийного восстановления.

  • Для обеспечения масштаба особенно для пилотных развертываний убедитесь, что вы обеспечили наличие всей необходимой квоты узлов на резервном сайте, чтобы не пришлось ждать необходимую емкость во время полного развертывания. См. Запрос квоты узлов для решения Azure VMware.

  • Настройте функциональные роли домена, такие как контроллеры домена Active Directory, в дополнительной среде.

  • Решения от партнеров, таких как JetStream и Zerto, обычно доступны и проверяются на Решение Azure VMware. Они поддерживают большинство сценариев аварийного восстановления и могут обеспечить более быстрое восстановление с почти нулевым RPO.

  • VMware Site Recovery Manager, Jetstream и Zerto поддерживают миграцию из сторонних расположений в Azure VMware Solution.

  • VMware HCX также является экономичным решением для аварийного восстановления. Однако не рекомендуется использовать в больших производственных задачах, поскольку они требуют ручной оркестрации.

  • Для аварийного восстановления между частными облаками решения Azure VMware в разных регионах Azure необходимо включить ExpressRoute Global Reach между двумя основными каналами ExpressRoute. Эти цепи создают подключение от первичного к вторичному частному облаку при необходимости для таких решений, как VMware SRM и VMware HCX.

  • Для аварийного восстановления между частными облаками Azure VMware Solution в одном регионе Azure необходимо включить Azure VMware Solution Interconnect. Он создаёт маршрутизирующую связь между сетями управления и рабочей нагрузки в частных облаках Azure VMware Solution для обмена данными между облаками. Убедитесь, что маршрутизированное пространство IP-адресов в каждом частном облаке уникально и не пересекается.

  • При работе с аварийным восстановлением можно использовать одно и то же исходное IP-пространство в основном регионе Azure и дополнительном регионе Azure. Однако для этого требуются дополнительные усилия по проектированию и инженерии.

    • Сохраните те же IP-адреса: виртуальные машины на вторичном сайте Azure VMware Solution можно восстановить с помощью того же исходного IP-адреса, что и на основном сайте. Для этого метода создайте изолированные сегменты VLAN или NSX-T на вторичном сайте и убедитесь, что ни один из этих изолированных виртуальных ЛС или сегментов не подключен к среде. Измените маршруты аварийного восстановления, чтобы отразить, что подсеть перемещена на дополнительный сайт и новое расположение IP-адресов. Хотя этот метод работает, он также создает инженерные издержки при попытке полностью автоматизированного аварийного восстановления.

    • Использовать другие IP-адреса. Для восстановленных виртуальных машин можно также использовать другие IP-адреса. Если виртуальная машина перемещается на вторичный сайт, план восстановления в VMware Site Recovery Manager детализирует пользовательскую карту IP. Выберите эту карту, чтобы изменить IP-адрес. Виртуальные машины создаются в новых сегментах NSX-T и назначаются новые IP-адреса. Инструменты могут отличаться для различных решений аварийного восстановления.

  • Важные факторы для сценариев частичного и полного аварийного восстановления:

    • VMware Site диспетчер восстановления поддерживает частичное восстановление, которое восстанавливает только подмножество виртуальных машин и полное аварийное восстановление. Между двумя площадками решения Azure VMware в регионе 1 и регионе 2 все или некоторые виртуальные машины могут переключаться при отказе.

    • Требование хранения исходного IP-адреса для восстановленных виртуальных машин определяет, возможно ли частичное и полное аварийное восстановление.

    • Чтобы сохранить исходный IP-адрес при выполнении частичного аварийного восстановления в средстве управления восстановлением сайта, шлюз подсети должен перейти на вторичный сайт.

    Примечание.

    Аварийное восстановление в режиме активного ожидания не требует растяжения уровня 2.

Рекомендации по обеспечению аварийного восстановления при проектировании

  • При работе с решением Azure VMware на первичном и вторичном сайтах используйте VMware Site Recovery Manager. Основные и дополнительные сайты также называются защищенными сайтами и сайтами восстановления соответственно.

    Общие сведения о непрерывной репликации vSphere.

    Схема, показывающая высокоуровневый пример непрерывной репликации vSphere между двумя сайтами Azure VMware Solution.

    Подробный пример непрерывной репликации vSphere между основными и вторичными сайтами.

    Схема, демонстрирующая подробный пример непрерывной репликации vSphere между двумя сайтами решений Azure VMware.

  • Для бизнес-критических приложений Zerto и JetStream доступны в качестве решений по аварийному восстановлению для частного облака Azure VMware Solution. JetStream и Zerto построены на основе непрерывной защиты данных (CDP), используя фреймворк VMware vSphere API для фильтрации I/O (VAIO), что позволяет свести потерю данных к минимуму или вовсе ее избежать. Она также обеспечивает экономичное аварийное восстановление с помощью минимальных ресурсов.

  • Используйте Azure Site Recovery или Zerto, если виртуальные машины IaaS Azure являются целевым объектом аварийного восстановления для Решение Azure VMware частного облака.

  • Свести к минимуму входные данные вручную с помощью автоматизированных планов восстановления в каждом из соответствующих решений аварийного восстановления. Эти планы полезны при работе с VMware Site Recovery Manager или с партнерскими решениями. План восстановления позволяет объединять компьютеры в группы восстановления в случае отказа. Затем это помогает определить систематический процесс восстановления путем создания независимых единиц, которые могут переключаться на резервные в случае отказа.

  • Настройте тесты дыма или аварийное восстановление по крайней мере один раз в год, чтобы обеспечить работу планов восстановления должным образом. Возможности оркестрации выбранного средства аварийного восстановления определяют объем усилий, необходимых для проведения этих учений.

  • Используйте геополитические региональные пары в качестве вторичной среды аварийного восстановления. Некоторые преимущества региональных пар включают приоритетное восстановление региона, последовательные обновления, физическую изоляцию и хранилище данных в определенном регионе.

  • Сохраняйте адресные пространства разными, чтобы избежать перекрытия IP-адресов между двумя сайтами. Например, можно использовать 192.168.0.0/16 для региона 1 и 10.0.0.0/16 для региона 2.

  • Используйте подключение ExpressRoute Global Reach между основными и вторичными частными облаками в разных регионах. Дополнительные сведения и рекомендации по работе с сетью см. в соответствующей области проектирования.

Следующие шаги

Ознакомьтесь с рекомендациями по первоначальному развертыванию Решения Azure VMware и автоматизации операций.