Поделиться через


Документация по надежности Azure

Документация по надежности Azure содержит сведения о том, что означает надежность в облачной платформе, как облако Azure поддерживает надежность, а также о том, каким образом можно настроить каждую службу Azure для поддержки надежного решения.

Документация организована в следующих разделах:

  • Руководства по надежности Azure по службе содержат руководства по обеспечению надежности каждой службы Azure, включая зоны доступности, поддержку нескольких регионов и поддержку резервного копирования.
  • Основы надежности содержат основные понятия надежности, такие как:
    • Непрерывность бизнес-процессов, высокий уровень доступности и аварийное восстановление.
    • Избыточность, репликация (избыточность данных) и резервное копирование
    • Переключение на резерв и возврат к исходной системе.
    • Общая ответственность между корпорацией Майкрософт и вами.
  • Регионы Azure содержат сведения о регионах Azure, парных и неперемеченных регионах и различных конфигурациях регионов.
  • Зоны доступности Azure содержат сведения о том, как они поддерживают высокий уровень доступности и аварийное восстановление. В этом разделе также содержатся списки служб и регионов Azure, поддерживающих зоны доступности.

Что такое надежность?

Надежность относится к способности рабочей нагрузки последовательно выполняться на ожидаемом уровне и в соответствии с требованиями непрерывности бизнес-процессов. Надежность — это ключевая концепция облачных вычислений. В Azure надежность достигается с помощью сочетания факторов, включая проектирование самой платформы, ее служб, архитектуру приложений и реализацию рекомендаций.

Ключевым подходом к обеспечению надежности рабочей нагрузки является устойчивость, которая заключается в способности рабочей нагрузки противостоять сбоям и восстанавливаться после отказов. Azure предлагает ряд функций устойчивости, таких как зоны доступности, поддержка нескольких регионов, репликация данных и возможности резервного копирования и восстановления. Эти функции следует учитывать при разработке рабочей нагрузки для удовлетворения требований к непрерывности бизнес-процессов.

Документация организована в следующих разделах:

Руководства по надежности Azure по службе

Каждая служба Azure имеет собственные уникальные характеристики надежности. Azure предоставляет набор руководств по надежности для конкретной службы, которые помогут вам разработать и реализовать надежную рабочую нагрузку, и рекомендации помогут вам понять, как лучше использовать службу для удовлетворения потребностей бизнеса. Каждое руководство может содержать следующие разделы в зависимости от того, какие функции надежности она поддерживает:

В каждом руководстве по службе надежности обычно содержатся сведения о том, как служба поддерживает ряд возможностей надежности, в том числе:

  • Зоны доступности, такие как зональные и зонально-избыточные параметры развертывания, маршрутизация трафика и репликация данных между зонами, что происходит в случае сбоя зоны, возврат к исходному состоянию и как настроить ваши ресурсы для поддержки зон доступности.
  • Поддержка нескольких регионов, включая настройку многорегиональной или георезервной поддержки восстановления, маршрутизацию трафика и репликацию данных между регионами, опыт работы в условиях недоступности региона, а также поддержку отработки отказа и восстановления. Для некоторых служб, не имеющих собственной поддержки в нескольких регионах, руководства представляют альтернативные подходы к развертыванию в нескольких регионах.
  • Поддержка резервного копирования, например управляемые корпорацией Майкрософт и управляемые клиентом возможности резервного копирования, где они хранятся, как их можно восстановить, и доступны ли они только в пределах региона или между регионами.

Для получения дополнительной информации и списка руководств по надежности служб см. Руководства по надежности служб.

Подсказка

Надежность также включает в себя другие элементы разработки решения, включая безопасное развертывание изменений, управление производительностью, чтобы избежать простоя из-за высокой нагрузки, а также способ тестирования и проверки каждой части решения. Дополнительные сведения см. в статье Azure Well-Architected Framework.

Основы надежности

В разделе "Основы надежности" представлен обзор ключевых концепций и принципов, лежащих в основе надежности в Azure.

Непрерывность бизнес-процессов, высокий уровень доступности и аварийное восстановление

Планирование непрерывности бизнес-процессов можно понять как текущий процесс управления рисками с помощью высокого уровня доступности и проектирования аварийного восстановления.

При рассмотрении непрерывности бизнес-процессов важно понимать следующие термины:

  • Непрерывность бизнес-процессов — это состояние, в котором бизнес может продолжать работу во время сбоев, сбоев или аварий. Для обеспечения непрерывности бизнес-процессов требуется упреждающее планирование, подготовка и реализация устойчивых систем и процессов.

  • Высокий уровень доступности заключается в разработке решения для удовлетворения потребностей бизнеса в доступности и устойчивости к повседневным проблемам, которые могут повлиять на требования времени простоя.

  • Аварийное восстановление заключается в планировании того, как справиться с редкими рисками и катастрофическими сбоями, которые могут привести.

Сведения о планировании непрерывности бизнес-процессов и непрерывности бизнес-процессов с помощью проектирования высокого уровня доступности и аварийного восстановления см. в статье "Что такое непрерывность бизнес-процессов, высокий уровень доступности и аварийное восстановление?".

Избыточность, репликация и резервное копирование

Мы часто думаем об облаке как глобально распределенной, универсальной системе. Однако в действительности облако состоит из оборудования, работающего в центрах обработки данных. Для обеспечения устойчивости необходимо учитывать некоторые риски, связанные с расположением физических мест выполнения облачных компонентов.

Избыточность — это возможность поддерживать несколько идентичных копий компонента службы, а также использовать эти копии таким образом, чтобы один компонент не стал одной точкой сбоя.

Репликация или избыточность данных — это возможность поддерживать несколько копий данных, называемых репликами.

Резервное копирование — это возможность поддерживать метку времени, которую можно использовать для восстановления потерянных данных.

Общие сведения о избыточности, репликации и резервном копировании см. в статье "Что такое избыточность, репликация и резервное копирование?".

Отказоустойчивость и восстановление после сбоя

Распространенной причиной сохранения избыточных копий как приложений, так и реплик данных является возможность выполнить переключение на резервную систему. При резервном переключении можно перенаправить трафик и запросы от неисправных экземпляров на исправные. Затем, как только исходные экземпляры снова станут работоспособными, вы можете выполнить возврат к исходной конфигурации.

Дополнительные сведения об отработке отказа и восстановлении после сбоя см. в разделе "Что такое отработка отказа и восстановление после сбоя?".

Общая ответственность

Устойчивость определяет способность рабочей нагрузки автоматически исправлять и восстанавливаться из-за различных видов сбоев или отказов. Службы Azure создаются для обеспечения устойчивости ко многим общим сбоям, и каждый продукт предоставляет соглашение об уровне обслуживания (SLA), описывающее время простоя, которое можно ожидать. Однако общая устойчивость рабочей нагрузки зависит от того, как вы разработали решение для удовлетворения бизнес-потребностей. Некоторые планы непрерывности бизнес-процессов могут рассматривать некоторые риски сбоя, которые могут быть неважными, в то время как другие могут рассматривать их критическими.

На общедоступной облачной платформе Azure устойчивость — это общая ответственность между корпорацией Майкрософт и вами. Так как в каждой рабочей нагрузке вы разрабатываете и развертываете разные уровни устойчивости, важно понимать, кто несет основную ответственность за каждый из этих уровней с точки зрения устойчивости. Чтобы лучше понять, как работает общая ответственность, особенно при столкновении с сбоем или катастрофой, см . раздел "Общая ответственность за устойчивость".

Регионы Azure

Azure предоставляет более 60 регионов по всему миру, расположенных в разных регионах. Каждый регион — это набор физических объектов, включающих центры обработки данных и сетевую инфраструктуру. Все регионы могут быть разделены на географические области, называемые географическими областями. Каждая география — это граница расположения данных и может содержать один или несколько регионов.

Зоны доступности Azure

Многие регионы Azure предоставляют зоны доступности, которые разделены группами центров обработки данных в пределах региона. Зоны доступности достаточно близки, чтобы иметь подключения с низкой задержкой к другим зонам доступности, но достаточно далеко друг от друга, чтобы снизить вероятность того, что несколько из них будут затронуты локальными сбоями или погодой. Зоны доступности имеют независимую инфраструктуру питания, охлаждения и сетевой инфраструктуры. Они разработаны таким образом, чтобы если одна зона испытывала сбой, то региональные службы, емкость и высокий уровень доступности поддерживаются остальными зонами.