Надежность в Операторе Azure Nexus
Внимание
Эта функция в настоящее время доступна для предварительного ознакомления. Предварительные версии предоставляются только в том случае, если вы принимаете дополнительные условия использования.
В этой статье описывается поддержка надежности в Операторе Azure Nexus и охватывает устойчивость внутри региона с зонами доступности. Более подробный обзор надежности в Azure см. в статье "Надежность Azure".
Поддержка зоны доступности
Зоны доступности — это физически отдельные группы центров обработки данных в каждом регионе Azure. При сбое одной зоны службы могут выполнять отработку отказа в одну из оставшихся зон.
Дополнительные сведения о зонах доступности в Azure см. в статье "Что такое зоны доступности?"
Оператор Azure Nexus предлагает развертывания, избыточные между зонами доступности, по умолчанию. Компоненты Nexus операторов, такие как Диспетчер кластеров и контроллер Network Fabric, развертываются в кластере Служба Azure Kubernetes (AKS), который включен с зонами доступности. Другие зависимости служб, такие как служба учетной записи хранения и KeyVault, также настроены с избыточностью зоны доступности.
Примечание.
Локальный экземпляр Оператора Nexus реализует много стойку, которая обеспечивает физическую избыточность на всех уровнях стека. Каждая стойка предназначена в качестве домена сбоя или зоны Nexus. Рабочие нагрузки клиентов можно развертывать на нескольких стойких или узлах, что, по сути, обеспечивает аналогичный интерфейс зоны доступности.
Простой интерфейс зоны доступности Azure
В сценарии уменьшения зоны доступности вызовы API к кластеру и поставщикам ресурсов будут продолжать работать без прерывания. Влияние на текущие рабочие нагрузки локального клиента или на возможность создания новых рабочих нагрузок клиента не будет. Кроме того, потеря данных не должна возникать, так как обеспечивается устойчивость оператора Nexus и других типов ресурсов.
Поддержка отработки отказа в зоне доступности Azure
В случае сбоя зоны доступности повторное подключение к другой зоне доступности Azure выполняется автоматически и не требует взаимодействия с пользователем.
Доступность в развертываниях экземпляров Operator Nexus
Обеспечение доступности в развертываниях рабочих нагрузок Оператора Azure Nexus является разделением ответственности. Как указано в предыдущем разделе, ресурсы на основе Оператора Nexus AKS развертываются с избыточностью зоны доступности. В этом разделе мы рассмотрим рекомендации по доступности локальной рабочей нагрузки.
Как правило, целевые показатели доступности достигаются с помощью локальных и геоизбыточного развертываний.
Зона Nexus: механизм избыточности локальной рабочей нагрузки
Локальные экземпляры Оператора Nexus состоят из нескольких стоек, обеспечивающий физическую избыточность на всех уровнях стека. Каждая стойка назначается в качестве домена сбоя и, таким образом, может быть настроена в качестве зоны Nexus, где эти зоны могут и, предпочтительно, должны использоваться для развертывания локальных избыточных рабочих нагрузок.
Экземпляр Nexus: механизм избыточности георабочая нагрузка
Локальные экземпляры Nexus размещаются в определенном регионе Azure. Как упоминалось ранее, используемые службы Azure и ресурсы Nexus развертываются в нескольких зонах доступности этого региона Azure.
Экземпляры Nexus, географически распределенные, т. е. не в одном и том же центре обработки данных оператора (возможно, даже в одном географическом регионе) и размещенные в разных регионах Azure должны использоваться для избыточного развертывания рабочих нагрузок для геоизбыточного обеспечения.
Предупреждение
Например, развертывание рабочих нагрузок в двух географически распределенных экземплярах Nexus недостаточно для достижения истинной геоизбыточности, если геоизбыточные экземпляры Nexus не размещаются в разных регионах Azure.
В маловероятном случае, когда регион Azure становится недоступным, службы Azure, а также ресурсы Nexus в этом регионе также становятся недоступными. Хотя это не влияет на выполнение рабочих нагрузок, это предотвращает такие возможности, как запуск новых рабочих нагрузок, аналитика и т. д.
Несколько экземпляров Nexus в одном географическом расположении
Существуют сценарии, в которых необходимо развернуть несколько экземпляров Nexus в одном географическом расположении. Геоизбыточность рабочей нагрузки, очевидно, не достигается путем развертывания рабочих нагрузок в экземплярах Nexus в том же географическом расположении.
Одним из соображений надежности, кроме доступности, является устойчивость и возможность восстановления после сбоев. Восстановление от сбоев и возможность удовлетворения целей во время восстановления требует, чтобы мы ограничиваем "взрыв" или радиус влияния сбоев. В сценарии развертывания нескольких экземпляров Nexus в одном географическом расположении устойчивый дизайн требует размещения этих экземпляров Nexus в разных регионах Azure. Таким образом, если регион Azure завершается сбоем, его влияние ограничено одним экземпляром Nexus.
Следующие шаги
Руководство Центра архитектуры Azure по зонам доступности.