Изменить

Поделиться через


Аварийное восстановление для платформы данных Azure — сведения о сценарии

Azure Synapse Analytics
Машинное обучение Azure
Azure Cosmos DB
Azure Data Lake
Центры событий Azure

Топология службы данных

На высоком уровне топологию службы данных для платформы данных Contoso можно проиллюстрировать следующим образом: Схема высокоуровневой топологии службы данных Contoso. эта логическая схема абстрагирует ключевые функции экосистемы данных Contoso в упрощенное, высокоуровневое представление. Это абстрактное представление поддерживает разделы, охватывающие развертывания сценариев, в соответствии с выбором стратегии аварийного восстановления (АВАРИЙНОго восстановления) и разделением обязанностей в процессе восстановления службы.

Влияние на аварийное восстановление и активность клиентов

В следующих разделах представлена разбивка действий Contoso, необходимых для событий аварийного восстановления различных последствий.

Область: базовые компоненты

  • Идентификатор Записи Майкрософт, включая права роли

    • Выбор SKU Contoso: Premium P1
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure: N/A
  • Группы управления

    • Выбор номера SKU Contoso: N/A
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure: N/A
  • Подписки

    • Выбор номера SKU Contoso: N/A
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure: N/A
  • Azure Key Vault

    • Выбор номера SKU Contoso: Стандартный
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure: N/A
  • Azure Monitor

    • Выбор номера SKU Contoso: N/A
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure: N/A
  • Microsoft Defender для облака

    • Выбор номера SKU Contoso: N/A
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure: N/A
  • Управление затратами

    • Выбор номера SKU Contoso: N/A
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure: N/A
  • Azure DNS

    • Выбор номера SKU Contoso: N/A
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure: N/A
  • Наблюдатель за сетями

    • Выбор номера SKU Contoso: N/A
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure: N/A
  • Хранилище служб восстановления

  • виртуальная сеть (виртуальные сети), включая подсети, определяемые пользователем маршруты (UDR) и группы безопасности сети (NSG)

    • Выбор номера SKU Contoso: N/A
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure. Компании Contoso потребуется повторно развернуть виртуальные сети Платформы данных и Foundation с присоединенными группами определяемых пользователем пользователей и группами безопасности сети в дополнительный регион.
    • Примечания
      • Диспетчер трафика можно использовать для геонаправки трафика между регионами, включающих структуры виртуальной сети реплики. Если у них есть одно адресное пространство, они не могут быть подключены к локальной сети, так как это приведет к проблемам маршрутизации. В случае аварии и потери виртуальной сети в одном регионе вы можете подключить к своей локальной сети другую виртуальную сеть с таким же адресным пространством, размещенную в доступном регионе.
  • Группы ресурсов

    • Выбор номера SKU Contoso: N/A
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure. Компании Contoso потребуется повторно развернуть группы ресурсов Платформы данных и Foundation в дополнительном регионе.
    • Примечания
      • Это действие будет устранено путем реализации стратегии "Теплый запас", имеющей топологию сети и группы ресурсов, доступную в дополнительном регионе.
  • Брандмауэр Azure

    • Выбор номера SKU Contoso: Стандартный
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: Компании Contoso потребуется проверить доступность и повторно развернуть при необходимости.
      • Сбой региона Azure: Компании Contoso потребуется повторно развернуть Брандмауэр Azure Foundation в дополнительном регионе.
    • Примечания
      • Брандмауэр Azure можно создать с помощью Зоны доступности для повышения доступности.
      • Стратегия "Теплый запас" позволит устранить эту активность.
  • Azure DDoS

    • Выбор SKU Contoso: Защита сети
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure. Компании Contoso потребуется создать план защиты от атак DDoS для виртуальных сетей Фонда в дополнительном регионе.
  • ExpressRoute — канал

    • Выбор номера SKU Contoso: Стандартный
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure: N/A
    • Примечания
      • Физический канал останется ответственностью корпорации Майкрософт и партнера по подключению к восстановлению.
  • VPN-шлюз

    • Выбор номера SKU Contoso: VpnGw1
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: Компании Contoso потребуется проверить доступность и повторно развернуть при необходимости.
      • Сбой региона Azure: Компании Contoso потребуется повторно развернуть VPN-шлюз Foundation в дополнительном регионе.
    • Примечания
      • VPN-шлюз можно создать с помощью Зоны доступности для повышения доступности.
      • Стратегия "Теплый запас" позволит устранить эту активность.
  • Load Balancer

    • Выбор номера SKU Contoso: Стандартный
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: Компании Contoso потребуется проверить доступность и повторно развернуть при необходимости.
      • Сбой региона Azure: Компании Contoso потребуется повторно развернуть подсистемы балансировки нагрузки Foundation в дополнительном регионе.
    • Примечания
  • Azure DevOps

Область: компоненты платформы данных

  • Учетная запись хранения — Azure Data Lake 2-го поколения

    • Выбор SKU Contoso: локально избыточное хранилище (LRS)
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: Компании Contoso потребуется проверить доступность и повторно развернуть при необходимости.
      • Сбой региона Azure. Компании Contoso потребуется повторно развернуть учетные записи хранения платформы данных и восстановить их с помощью данных в дополнительном регионе.
    • Примечания
      • Учетные записи хранения имеют широкий спектр вариантов избыточности данных от избыточности основного региона до избыточности дополнительного региона.
      • Для данных избыточности дополнительного региона данные реплицируются в дополнительный регион асинхронно. Сбой, влияющий на основной регион, может привести к потере данных, если основной регион не может быть восстановлен. служба хранилища Azure обычно имеет цель точки восстановления (RPO) менее 15 минут.
      • В случае регионального сбоя учетные записи хранения, которые, являются геоизбыточными, будут доступны в дополнительном регионе как LRS. Для повышения уровня нагрузки этих компонентов в дополнительном регионе потребуется применить дополнительную конфигурацию, чтобы быть геоизбыточным.
  • Azure Synapse — конвейеры

    • Выбор номера SKU Contoso: Вычисляемый оптимизированный 2-го поколения
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure: Компании Contoso потребуется развернуть и восстановить платформу данных Azure Synapse Analytics в дополнительном регионе и повторно развернуть конвейеры.
    • Примечания
      • Автоматические точки восстановления удаляются через семь дней.
      • Доступны определяемые пользователем точки восстановления. В настоящее время существует потолок из 42 определяемых пользователем точек восстановления, которые автоматически удаляются через семь дней.
      • Synapse также может выполнять восстановление базы данных в локальном или удаленном регионе, а затем немедленно ПРИОСТАНОВИТЬ экземпляр. Этот процесс будет нести только затраты на хранение и нулевыми затратами на вычислительные ресурсы. Это позволяет сохранить "динамическую" копию базы данных с определенными интервалами.
  • Центры событий Azure

    • Выбор номера SKU Contoso: Стандартный
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure. Компании Contoso потребуется повторно развернуть экземпляр Центров событий в дополнительном регионе.
    • Примечания
  • Центры Интернета вещей Azure

    • Выбор номера SKU Contoso: Стандартный
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure. Компании Contoso потребуется повторно развернуть Центр Интернета вещей в дополнительном регионе.
    • Примечания
  • Azure Stream Analytics

    • Выбор номера SKU Contoso: Стандартный
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure. Компании Contoso потребуется повторно развернуть Центр Интернета вещей в дополнительном регионе.
    • Примечания
      • Ключевой особенностью Stream Analytics является возможность восстановления после сбоя узла.
  • Службы ИИ Azure (прежнее название — Cognitive Services)

    • Выбор номера SKU Contoso: оплата по мере использования
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure: N/A
  • Машинное обучение Azure

    • Выбор номера SKU Contoso: экземпляры общего назначения — экземпляры серии D
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: Компании Contoso потребуется проверить доступность и повторно развернуть при необходимости.
      • Сбой зоны доступности: Компании Contoso потребуется проверить доступность и повторно развернуть при необходимости.
      • Сбой региона Azure: Компании Contoso потребуется повторно развернуть Машинное обучение в дополнительном регионе.
    • Примечания
  • Azure Synapse — пулы обозревателя данных

    • Выбор номера SKU Contoso: вычисляемый оптимизированный, малый (4 ядра)
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure: Компании Contoso потребуется повторно развернуть пулы и конвейеры Azure Synapse — пулы и конвейеры Azure в дополнительный регион.
  • Azure Synapse — пулы Spark

    • Выбор номера SKU Contoso: Оптимизированный для вычислений 2-го поколения
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure. Компании Contoso потребуется повторно развернуть пулы и конвейеры Azure Synapse — Пулы Spark в дополнительный регион.
    • Примечания
      • Если используется внешнее хранилище метаданных Hive, для этого также потребуется стратегия восстановления.
        • Azure Site Recovery можно использовать для хранилища метаданных SQL Server.
        • Хранилище метаданных MySQL будет использовать функцию геовосстановление или межрегиональный реплика чтения.
  • Azure Synapse — бессерверные и выделенные пулы SQL

    • Выбор номера SKU Contoso: Оптимизированный для вычислений 2-го поколения
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: N/A
      • Сбой региона Azure. Компании Contoso потребуется развернуть и восстановить платформу данных Azure Synapse Analytics в дополнительном регионе.
    • Примечания
      • Автоматические точки восстановления удаляются через семь дней.
      • Доступны определяемые пользователем точки восстановления. В настоящее время существует потолок из 42 определяемых пользователем точек восстановления, которые автоматически удаляются через семь дней.
      • Synapse также может выполнять восстановление базы данных в локальном или удаленном регионе, а затем немедленно ПРИОСТАНОВИТЬ экземпляр. Это приведет только к затратам на хранение и нулевым затратам на вычислительные ресурсы. Это решение позволяет хранить "динамическую" копию базы данных с определенными интервалами.
  • Power BI

  • Azure Cosmos DB

    • Выбор SKU Contoso: однорегионная запись с периодической резервной копией
    • Влияние аварийного восстановления
    • Примечания
      • Учетные записи с одним регионом могут потерять доступность после регионального сбоя. Чтобы обеспечить высокий уровень доступности экземпляра Azure Cosmos DB, настройте его с одним регионом записи и по крайней мере вторым (чтением) регионом и включите отработку отказа, управляемой службой.
      • Чтобы избежать потери доступности записи, рекомендуется настроить рабочие нагрузки с параметром "Включить отработку отказа, управляемой службой", чтобы включить автоматическую отработку отказа в доступные регионы.
  • Поиск ИИ Azure (прежнее название — Когнитивный поиск)

    • Выбор номера SKU Contoso: Standard S1
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: Компании Contoso потребуется проверить доступность и повторно развернуть при необходимости.
      • Сбой зоны доступности: Компании Contoso потребуется проверить доступность и повторно развернуть при необходимости.
      • Сбой региона Azure. Компании Contoso потребуется повторно развернуть поиск ИИ в дополнительном регионе.
    • Примечания
  • Azure Data Share

    • Выбор номера SKU Contoso: N/A
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: Компании Contoso потребуется проверить доступность и повторно развернуть при необходимости.
      • Сбой зоны доступности: Компании Contoso потребуется проверить доступность и повторно развернуть при необходимости.
      • Сбой региона Azure. Компании Contoso потребуется повторно развернуть общий ресурс данных в дополнительном регионе.
    • Примечания
  • Сфера

    • Выбор номера SKU Contoso: N/A
    • Влияние аварийного восстановления
      • Сбой центра обработки данных Azure: N/A
      • Сбой зоны доступности: Компании Contoso потребуется проверить доступность и повторно развернуть при необходимости.
      • Сбой региона Azure. Компании Contoso потребуется развернуть экземпляр Microsoft Purview в дополнительном регионе.
    • Примечания
      • Это действие будет устранено путем реализации стратегии "Теплый запас", имея второй экземпляр Microsoft Purview Azure, доступный в дополнительном регионе.
      • Подход "Теплый запас" имеет следующие ключевые выноски:
        • Основные и вторичные учетные записи Microsoft Purview Azure нельзя настроить для одной фабрики данных Azure, Azure Data Share и Учетных записей Azure Synapse Analytics, если это применимо. В результате происхождение из Фабрика данных Azure и Azure Data Share невозможно увидеть в дополнительных учетных записях Microsoft Purview Для Azure.
        • Среды выполнения интеграции относятся к учетной записи Microsoft Purview Azure. Таким образом, если сканирование должно выполняться в основных и вторичных учетных записях Microsoft Purview в параллельном режиме, необходимо поддерживать несколько локальных сред выполнения интеграции.

Примечание.

Этот раздел предназначен в качестве общих рекомендаций. Документация поставщика по аварийному восстановлению, избыточности и резервному копированию должна быть рассмотрена для правильного подхода к новому компоненту или службе.

"Сбой центра обработки данных Azure" охватывает ситуацию, когда затронутый регион не предоставляет Зоны доступности.

Если в момент аварии произошли новые или обновленные конфигурации или выпуски, они должны быть проверены и повторно развернуты (при необходимости) в рамках работы, чтобы перенести платформу до текущей даты.

Следующие шаги

Теперь, когда вы узнали о сценарии, вы можете узнать о рекомендациях, связанных с этим сценарием.