Непрерывность бизнес-процессов и аварийное восстановление для Управляемый экземпляр SQL с поддержкой Azure Arc
Управляемый экземпляр SQL с поддержкой Azure Arc предоставляет возможности обеспечения непрерывности бизнес-процессов и аварийного восстановления (BCDR), которые помогают предприятиям восстанавливаться от сбоев и продолжать работать с минимальным временем простоя.
В этой статье содержатся основные рекомендации по проектированию и настройке возможностей непрерывности бизнес-процессов, таких как восстановление на определенный момент времени, высокий уровень доступности и аварийное восстановление.
Архитектура
На следующих схемах архитектуры показаны возможности высокого уровня доступности Управляемый экземпляр SQL с поддержкой Arc в уровне служб критически важный для бизнеса, который поддерживает отработку отказа с почти нулевым временем простоя. Если основной экземпляр завершается сбоем, подсистема балансировки нагрузки останавливает отправку трафика в этот экземпляр. Затем один из вторичных экземпляров повышен до первичного, а недавно созданный экземпляр начинает получать трафик чтения и записи из подсистемы балансировки нагрузки. После возвращения экземпляра из строя он добавляется в качестве дополнительного экземпляра.
На следующей схеме архитектуры показано, как Управляемый экземпляр SQL с поддержкой Arc можно развернуть в двух отдельных кластерах Kubernetes на двух разных сайтах для аварийного восстановления.
На следующей схеме архитектуры показано, как Управляемый экземпляр SQL с поддержкой Arc реагировать при запуске отработки отказа аварийного восстановления.
Рекомендации по проектированию
Чтобы оценить влияние Управляемый экземпляр SQL с поддержкой Azure Arc на общую модель BCDR, ознакомьтесь с рекомендациями BCDR для целевых зон в области непрерывности бизнес-процессов и аварийного восстановления. Обратите внимание, что основное внимание уделяется непрерывности бизнес-процессов и аварийному восстановлению только для обеспечения непрерывности бизнес-процессов, но высокий уровень доступности и устойчивость экземпляра также зависит от доступности базовой инфраструктуры Kubernetes.
Восстановление на определенный момент времени
Определите целевые объекты для целевой точки восстановления (RPO) и целевой цели времени восстановления (RTO).
Определите, сколько времени вы хотите сохранить и восстановить резервные копии в пределах поддерживаемых ограничений хранения.
Рассмотрим последствия для хранения и затраты на увеличение срока хранения резервных копий. Срок хранения по умолчанию — семь дней. С этой длительностью вы можете восстановить до семи дней, и вы получаете одну полную резервную копию, ежедневное разностное и резервное копирование журналов транзакций примерно каждые пять минут.
Рассмотрим, какой класс хранилища следует использовать для постоянного тома для резервных копий. Инструкции см. в разделе "Дисциплины хранилища" для Управляемый экземпляр SQL с поддержкой Azure Arc.
Рассмотрим размер постоянного тома для резервных копий в контексте ожидаемого размера данных и настроенного периода хранения.
Рекомендации по хранению см. в дисциплинах хранилища для Управляемый экземпляр SQL с поддержкой Azure Arc.
Резервные копии всегда выполняются на первичной реплике. Учитывайте влияние производительности процессов резервного копирования и восстановления при определении ресурсов, выделенных экземпляру.
Учитывайте, что восстановление базы данных на определенный момент времени не может перезаписать существующую базу данных. Однако они могут восстанавливать данные в новую базу данных в том же экземпляре.
Рассмотрим дополнительные шаги, необходимые для полного восстановления базы данных, если приложение находится в сети во время процесса восстановления.
Рассмотрим дополнительные шаги, необходимые для восстановления базы данных в экземпляре с несколькими репликами, как описано в разделе "Восстановление базы данных в экземпляре с несколькими репликами".
Определите средства, используемые администраторами базы данных для настройки и восстановления резервных копий. Дополнительные сведения см. в статье "Подключение к Управляемый экземпляр SQL с поддержкой Azure Arc".
Высокая доступность
Просмотрите требования к доступности рабочей нагрузки и определите уровень служб, который лучше всего подходит для развертывания Управляемый экземпляр SQL с поддержкой Arc:
- На уровне служб общего назначения доступна одна реплика, а высокая доступность достигается с помощью оркестрации Kubernetes.
- В критически важный для бизнеса уровне служб Управляемый экземпляр SQL с поддержкой Azure Arc предоставляет содержащуюся группу доступности в дополнение к тому, что изначально предоставляет оркестрация Kubernetes.
Рассмотрим потенциальные бизнес-последствия простоя на уровне служб общего назначения, что может привести к существованию только одной реплики.
Рассмотрим, сколько реплик ( по три) развертывается на уровне служб критически важный для бизнеса.
При развертывании экземпляра на уровне служб критически важный для бизнеса с двумя или более репликами можно настроить вторичные реплики как доступные для чтения. Определите количество вторичных реплик для развертывания на уровне служб критически важный для бизнеса. Сведения об изменении числа см. в разделе "Настройка доступных для чтения вторичных файлов".
Решите о приоритете согласованности доступности с помощью количества вторичных реплик, необходимых для фиксации транзакции на уровне служб критически важный для бизнеса с помощью необязательного параметра --sync-secondary-to-commit. Если между репликами возникают проблемы с подключением, основной может не зафиксировать транзакции:
- В конфигурации с двумя репликами транзакция должна быть зафиксирована в обеих репликах для получения сообщения об успешном выполнении.
- В конфигурации с тремя репликами по крайней мере две из трех реплик должны зафиксировать транзакцию, чтобы вернуть сообщение об успешном выполнении.
Определите, нужно ли назначить определенную реплику в качестве основной. Сведения об указании первичной реплики см. в разделе "Предпочтительная первичная реплика".
Определите, какой тип службы Kubernetes вы будете использовать, LoadBalancer или NodePort. Если вы используете подсистему балансировки нагрузки, приложения могут повторно подключиться к одной первичной конечной точке, а Kubernetes перенаправит подключение к новой первичной точке. Если используется порт узла, приложения должны повторно подключиться к новому IP-адресу.
Аварийное восстановление
Экземпляры Управляемый экземпляр SQL с поддержкой Azure Arc в гео-первичных и гео вторичных сайтах должны быть идентичными в вычислительных ресурсах и емкости, а также развертываются на одном уровне служб.
Определите расположение, в котором хранятся сертификаты зеркального отображения при создании конфигурации аварийного восстановления, доступной обоими кластерами, на которых размещен экземпляр.
Рассмотрим, как отслеживать время простоя основного экземпляра, чтобы решить, когда следует выполнить отработку отказа на дополнительный экземпляр.
Каждый экземпляр имеет собственные конечные точки. Рассмотрим, как приложения будут получать доступ к основной конечной точке с минимальным нарушением при отработке отказа.
Рекомендации по проектированию
В следующих разделах перечислены рекомендации по проектированию для восстановления на определенный момент времени, высокой доступности и аварийного восстановления.
Восстановление на определенный момент времени
При развертывании нового экземпляра Управляемый экземпляр SQL с поддержкой Arc всегда определите класс хранилища для резервных копий, чтобы избежать использования по умолчанию класса хранилища данных.
Используйте класс хранилища, поддерживающий ReadWriteMany (RWX) для тома резервных копий. Инструкции см. в дисциплинах хранилища для Управляемый экземпляр SQL с поддержкой Azure Arc.
Перед началом операции восстановления используйте необязательный параметр --dry-run , чтобы сначала проверить, будет ли операция успешно выполнена. Дополнительные сведения см. в статье "Создание базы данных из точки во времени" с помощью az CLI.
Создайте процесс отправки резервных копий, которые требуют более длительных периодов хранения в Azure или другом локальном холодном хранилище.
Следите за хранилищем, которое используется резервными копиями, чтобы определить, можно ли разместить более длительное хранение при необходимости.
Высокая доступность
Выполните регулярные детализации, чтобы проверить высокий уровень доступности экземпляра Управляемый экземпляр SQL с поддержкой Arc. Примеры детализации включают удаление модуля pod в экземпляре общего назначения и сбой реплики в критически важный для бизнеса экземпляре.
На уровне критически важный для бизнеса разверните экземпляр в конфигурации с тремя репликами вместо конфигурации с двумя репликами для достижения почти нулевой потери данных.
Для повышения доступности используйте LoadBalancer в качестве типа службы при развертывании экземпляра.
Ознакомьтесь с ограничениями высокого уровня доступности Управляемый экземпляр SQL с поддержкой Azure Arc.
Просмотрите поддерживаемые режимы доступности, чтобы решить, какой режим следует использовать в зависимости от потребностей высокого уровня доступности.
При развертывании экземпляра критически важный для бизнеса с несколькими репликами используйте одну из вторичных реплик для рабочих нагрузок чтения. Приложение строка подключения должно указать вторичную конечную точку в качестве прослушивателя службы для перенаправления на вторичные реплики. Сведения о конечных точках см. в разделе "Получение основных и вторичных конечных точек" и состояния группы доступности.
Сведения о рекомендациях по мониторингу доступности экземпляров см. в статье "Управление и мониторинг для Управляемый экземпляр SQL с поддержкой Azure Arc".
Аварийное восстановление
Убедитесь, что экземпляры с поддержкой Arc Управляемый экземпляр SQL имеют разные имена для первичных и вторичных сайтов, и что значение общего имени для сайтов идентично.
Выполните регулярные детализации аварийного восстановления, чтобы проверить процесс отработки отказа.
Создайте процесс запуска вручную и принудительной отработки отказа.
Чтобы понять рекомендации по мониторингу работоспособности кластеров и понять, когда требуется отработка отказа, см. статью "Управление и мониторинг для Управляемый экземпляр SQL с поддержкой Azure Arc".
Определите запись DNS для общего имени распределенной группы доступности на DNS-серверах, чтобы избежать необходимости вручную создавать записи DNS во время отработки отказа.
Следующие шаги
Дополнительные сведения о пути гибридного и многооблачного облака см. в следующих статьях:
- Что такое службы данных с поддержкой Azure Arc?
- Обзор: непрерывность бизнес-процессов Управляемый экземпляр SQL с поддержкой Azure Arc
- Проверка Kubernetes с поддержкой Azure Arc
- Управление портфелем между гибридными и многооблачными операциями
- Службы данных с поддержкой Azure Arc для автоматизированных сценариев с помощью Azure Arc Jumpstart
- Внедрение инноваций Azure в гибридные среды с помощью Azure Arc— путь обучения от Microsoft Learn