Поделиться через


Непрерывность бизнес-процессов и аварийное восстановление

Платформа бизнес-приложений Microsoft (BAP) предоставляет возможности по обеспечению непрерывности бизнес-процессов и аварийного восстановления (BCDR) для всех сред производственного типа в Dynamics 365 и приложениях SAAS Power Platform. В этой статье описываются подробности и методы, которые Microsoft использует для обеспечения устойчивости ваших производственных данных во время региональных перебоев в работе.

Резервное копирование рабочих сред

Microsoft стремится обеспечить высочайший уровень доступности сервисов для ваших критически важных приложений и данных. Корпорация Microsoft обеспечивает доступность базовой инфраструктуры и служб платформы через архитектуру обеспечения непрерывности бизнес-процессов и аварийного восстановления, обеспечивая геоизбыточность, при которой все данные из рабочих сред, за исключением сред по умолчанию, резервируются в парный дополнительный регион. Такие резервные копии называются гео-дополнительными копиями и создаются во время развертывания основной среды.

Схема, иллюстрирующая гео-дополнительную реплику хранилища данных и вычислительной инфраструктуры.

На рисунке выше показано, что когда основной регион A оказывается затронут во время перебоя в работе, среды производственного типа из региона A переключаются на дополнительный регион B, который работоспособен. Для сред других типов, таких как среда по умолчанию, пробная среда, песочница, среда рабочих групп или среда разработчика, никаких действий не предпринимается.

Чтобы узнать больше о защите данных в непроизводственных средах, см. Резервное копирование и восстановление сред.

Как вы будете уведомляться о перебоях в работе?

 Основным каналом донесения информации является Панель мониторинга "Работоспособность служб" (SHD) в центрах администрирования Microsoft и Power Platform. Команда по коммуникации Microsoft инициирует процесс, публикуя первоначальные сообщения, чтобы уведомить вас о сбое и опубликовать необходимые обновления в SHD по мере необходимости. Дополнительную информацию о том, как просматривать сообщения в центре администрирования, см. в разделе Главная страница панели мониторинга. Чтобы лучше подготовиться, посетите страницу готовности.    

Процессы отработки отказа и восстановления после отказа и критерии непрерывности бизнеса

Отработка отказа и восстановление после отказа — две основные задачи, выполняемые в процессе обеспечения непрерывности бизнес-процессов и аварийного восстановления (BCDR). Их цель состоит в том, чтобы минимизировать влияние аварии на доступность и производительность критически важных бизнес-функций и приложений.

Отработка отказа — это процесс переключения на назначенную гео-дополнительную резервную копию всех систем и данных с основного рабочего объекта. По завершении операции отработки отказа рабочая среда будет доступна с гео-дополнительного объекта.

Важно

Пока приложения для управления финансами и операциями работают в дополнительном регионе после отработки отказа, развертывание пакетов, Financial Reporting и отчеты Power BI недоступны.

Операция восстановления после отказа — это процесс возврата производства в исходное местонахождение после аварии или завершения запланированного обслуживания.

В рамках принятого в Microsoft стандарта непрерывности бизнес-процессов и аварийного восстановления (BCDR) каждый онлайн-сервис Microsoft в обязательном порядке ежегодно проверяет, тестирует и обновляет свой план BCDR. Отчет проверки плана непрерывности бизнес-процессов и аварийного восстановления Microsoft Cloud доступен клиентам в Service Trust Portal.

В случае непредвиденного сбоя в масштабах всего региона, например стихийного бедствия, которое затрагивает весь регион Azure, выполняются следующие действия и процессы.

Ответственность Microsoft Ответственность клиентов
Если Microsoft обнаруживает сбой и видит, что это влияет на клиентов, команда по коммуникации Microsoft отправляет необходимые сообщения и поддерживает информационную панель мониторинга работоспособности служб в актуальном состоянии. None
В случае сбоя Microsoft выполняет автоматическую отработку отказа путем переключения производственных экземпляров в дополнительный регион, если клиент НЕ ПОТЕРЯЕТ ДАННЫЕ. None
В случае сбоя Microsoft определяет, что произошла ПОТЕРЯ ДАННЫХ, после чего отработка отказа среды не инициируется без согласия или одобрения клиента. Узнав о текущем перебое в работе и увидев его ПОСЛЕДСТВИЯ, клиент обязан:
- Связаться с Microsoft через службу поддержки и выяснить степень потери данных, которая произойдет в случае инициирования отработки отказа.
- Если потеря данных будет приемлемой по стандартам организации, то клиент должен выразить свое согласие через службу поддержки, чтобы Microsoft инициировала отработку отказа.
Когда Microsoft определяет, что основной регион снова работает и полностью работоспособен, для производственных экземпляров выполняется ВОССТАНОВЛЕНИЕ ПОСЛЕ СБОЯ. Во время запланированного процесса восстановления после сбоя не происходит потери данных, но пользователи могут испытывать кратковременные перебои или отключения в течение этого периода. None

Самостоятельное аварийное восстановление (предварительная версия)

[Этот раздел содержит предварительную версию документации и может быть изменен.]

Внимание

  • Это предварительная версия функции.
  • Предварительные версии функций не предназначены для использования в производственной среде, а их функциональность может быть ограничена. Для этих функций действуют дополнительные условия использования и они доступны перед официальным выпуском, чтобы клиенты могли досрочно получить доступ и предоставить отзывы.

Аварийное восстановление — это возможность инфраструктуры Power Platform Premium, которая позволяет клиентам инициировать отработку отказа среды между регионами по принципу самообслуживания. Как правило, в учетной записи клиентов создано несколько сред разных типов. Эта возможность доступна специально для сред производственного типа и может быть включена для каждой среды. В настоящее время эта возможность недоступна для производственных сред управления финансами и операциями.

Включение самостоятельного аварийного восстановления

Прежде чем использовать эту возможность, необходимо включить самостоятельное аварийное восстановление для среды. Это одноразовое действие, которое подготавливает ресурсы и запускает процесс репликации данных между основным и дополнительным расположениями. Это может занять до 48 часов. Администраторы получат уведомление, когда процесс будет завершен.

Включение аварийного восстановления в среде не влияет ни на среду, ни на данные в ней.

Чтобы включить аварийное восстановление, выполните следующие действия.

  1. Перейдите к списку сред в центре администрирования Power Platform.
  2. Выберите рабочую среду, в которой необходимо включить самостоятельное аварийное восстановление.
  3. Выберите Аварийное восстановление на панели команд в верхней части страницы. Появится панель Аварийное восстановление.
  4. Выберите переключатель, чтобы изменить его на Включено.
  5. Выберите Сохранить.
  6. Среда на короткое время будет помещена на страницу Изменение сведений.
  7. Откроется страница Сведения о среде, на которой указано, что процесс включения функции начался.

Есть две причины, по которым вам может потребоваться использовать эту функцию:

  • Отработка аварийного восстановления.
  • Реагирование на чрезвычайные ситуации в случае крупного регионального отключения.

Отработки аварийного восстановления

В вашей компании могут быть задокументированы отработки аварийного восстановления как требование во внутренних планах обеспечения непрерывности бизнес-процессов. Существуют также отрасли и компании, которые могут быть обязаны в соответствии с государственными постановлениями проводить аудит своих возможностей BCDR. В таких случаях можно выполнить отработку аварийного восстановления в среде. Отработка аварийного восстановления позволяет выполнить самостоятельное аварийное восстановление без потери данных. Длительность действия отработки отказа может быть немного выше, пока все оставшиеся данные реплицируются в дополнительный регион.

Мы рекомендуем выполнять отработку на копии рабочей среды, так как это влечет за собой простои, которые могут длиться несколько минут. Например, может потребоваться скопировать рабочую среду в среду песочницы, а затем изменить тип с песочницы на рабочую.

Отработка отказа реагирования на чрезвычайные ситуации

Ожидается, что этот вариант будет выбран в случае чрезвычайной ситуации, то есть когда в основном регионе произошел сбой и доступ к средам или данным невозможен. Если выбран этот параметр, среда завершится сбоем без копирования дополнительных данных, кроме данных, которые были реплицированы до сбоя.

При реагировании на чрезвычайные ситуации вы видите объем потерь данных, представленный во времени, который можно сравнить с целевой точкой восстановления (RPO), если вы определите, что это приемлемо, и решите продолжить. Среда работает в состоянии выполнения до тех пор, пока не завершится аварийное восстановление и среда не вернется к нормальной работе из дополнительного региона.

Переключение обратно на основной регион

После завершения отработки или устранения сбоя рекомендуется переключить среду обратно в основной регион. Среда может работать с ограниченными ресурсами в парном регионе. Во время этой операции данные не теряются.

Статус аварийного восстановления среды

Администраторы могут определить текущее состояние аварийного восстановления и расположение среды на странице Сведения о среде. Администраторы также могут выбрать Аварийное восстановление на панели команд, чтобы открыть панель Аварийное восстановление.

Чтобы проверить задержку репликации данных в любое время, можно выбрать Аварийное восстановление и выбрать Реагирование на чрезвычайные ситуации в качестве причины аварийного восстановления. Откроется диалоговое окно подтверждения, содержащее время последней репликации между регионами для этой среды. Вы можете выбрать Отмена, если единственной целью была проверка потенциальной потери данных в случае операции отработки отказа. Имейте в виду, что время последней синхронизации всегда отличается в разное время, так как данные реплицируются непрерывно.

Документирование плана обеспечения непрерывности бизнеса

Мы рекомендуем вам проводить отработки аварийного восстановления или реагирования на чрезвычайные ситуации, если вы хотите, до того, как произойдет настоящая авария, чтобы вы могли задокументировать все действия, необходимые для любых точек интеграции, внешних для Power Platform. В этом случае ваша компания лучше подготовлена к восстановлению, если произойдет реальная катастрофа.

Примечание о предварительной версии

Во время предварительной версии плата за эту функцию не взимается, и клиент не может ее отключить. Когда функция станет общедоступной, пользователи, использующие предварительную версию, смогут сохранить ее или разрешить ее отключение с помощью Microsoft. Это никак не повлияет на расположение или возможности основной среды, если вы решите не выполнять обновление во время общей доступности.