Рекомендации по платформе приложений для критически важных рабочих нагрузок в Azure

Статья
07/30/2024

Azure предоставляет множество вычислительных служб для размещения высокодоступных приложений. Службы отличаются возможностями и сложностью. Рекомендуется выбирать службы на основе:

Нефункциональные требования к надежности, доступности, производительности и безопасности.
Факторы принятия решений, такие как масштабируемость, стоимость, операбельность и сложность.

Выбор платформы размещения приложений является критически важным решением, которое влияет на все другие области проектирования. Например, устаревшее или частное программное обеспечение разработки может не выполняться в службах PaaS или контейнерных приложениях. Это ограничение влияет на выбор вычислительной платформы.

Критически важное приложение может использовать несколько вычислительных служб для поддержки нескольких составных рабочих нагрузок и микрослужб, каждый из которых имеет определенные требования.

Эта область проектирования предоставляет рекомендации, связанные с выбором вычислительных ресурсов, проектированием и параметрами конфигурации. Мы также рекомендуем ознакомиться с деревом принятия решений для вычислений.

Внимание

Эта статья является частью серии жизненно важных рабочих нагрузок в рамках Azure Well-Architected Framework. Если вы не знакомы с этой серией, мы рекомендуем начать с Что такое критически важная рабочая нагрузка?.

Глобальное распределение ресурсов платформы

Типичный шаблон для критически важной рабочей нагрузки включает глобальные ресурсы и региональные ресурсы.

Службы Azure, которые не ограничены определенным регионом Azure, развертываются или настраиваются как глобальные ресурсы. Некоторые варианты использования включают распределение трафика в нескольких регионах, хранение постоянного состояния для всего приложения и кэширование глобальных статических данных. Если необходимо разместить архитектуру масштаба и глобальное распространение, рассмотрите, как ресурсы оптимально распределяются и тиражируются по регионам Azure.

Другие ресурсы развертываются в регионе. Эти ресурсы, которые развертываются в рамках метки развертывания, обычно соответствуют единице масштабирования. Однако регион может иметь несколько меток, и метка может иметь несколько единиц. Надежность региональных ресурсов имеет решающее значение, так как они отвечают за выполнение основной рабочей нагрузки.

На следующем рисунке показан высокоуровневый дизайн. Пользователь обращается к приложению через центральную глобальную точку входа, которая затем перенаправляет запросы на соответствующую метку регионального развертывания:

Diagram that shows a mission-critical architecture. Диаграмма, демонстрирующая критически важную архитектуру.

Для методологии проектирования, критической для миссии, требуется развертывание в нескольких регионах. Эта модель обеспечивает отказоустойчивость на региональном уровне, чтобы приложение оставалось доступным даже в случае сбоя всего региона. При разработке приложения с несколькими регионами рассмотрите различные стратегии развертывания, такие как активный/активный и активный/пассивный, а также требования к приложениям, так как в каждом подходе существуют значительные компромиссы. Для критически важных рабочих нагрузок мы настоятельно рекомендуем использовать активно-активную модель.

Не каждая рабочая нагрузка поддерживает или требует одновременного выполнения нескольких регионов. Чтобы принять оптимальное решение по проектированию, следует взвесить конкретные требования к приложению против возможных компромиссов. Для некоторых сценариев приложений, имеющих более низкие целевые показатели надежности, активные или пассивные или сегментирование могут быть подходящими альтернативами.

Зоны доступности могут обеспечивать высокодоступные региональные развертывания в различных центрах обработки данных в пределах одного региона. Почти все службы Azure доступны в двух типах конфигураций: зональная конфигурация, при которой служба делегируется определенной зоне; или конфигурация с избыточностью по зонам, при которой платформа автоматически гарантирует, что служба охватывает несколько зон и может выдержать сбой в одной из них. Эти конфигурации обеспечивают отказоустойчивость до уровня центра обработки данных.

Контейнеризация

Контейнер включает код приложения и связанные файлы конфигурации, библиотеки и зависимости, необходимые приложению. Контейнеризация предоставляет уровень абстракции для кода приложения и его зависимостей и создает разделение от базовой платформы размещения. Один пакет программного обеспечения очень переносим и может работать согласованно на различных платформах инфраструктуры и поставщиках облачных служб. Разработчикам не нужно перезаписывать код и развертывать приложения быстрее и надежнее.

Внимание

Рекомендуется использовать контейнеры для критически важных пакетов приложений. Они улучшают использование инфраструктуры, так как можно разместить несколько контейнеров в одной виртуализированной инфраструктуре. Кроме того, так как все программное обеспечение входит в контейнер, вы можете перемещать приложение по различным операционным системам независимо от версий среды выполнения или библиотеки. Управление также проще с контейнерами, чем с традиционным виртуализированным размещением.

Критически важные приложения должны быстро масштабироваться, чтобы избежать узких мест производительности. Так как образы контейнеров предварительно созданы, можно ограничить запуск только во время загрузки приложения, что обеспечивает быструю масштабируемость.

Размещение контейнеров и оркестрация

Несколько платформ приложений Azure могут эффективно размещать контейнеры. Существуют преимущества и недостатки, связанные с каждой из этих платформ. Сравните параметры в контексте бизнес-требований. Однако всегда оптимизируйте надежность, масштабируемость и производительность. Дополнительные сведения см. в следующих статьях:

Внимание

Служба Azure Kubernetes (AKS) и контейнерные приложения Azure должны быть одними из ваших первых вариантов для управления контейнерами в зависимости от ваших потребностей. Хотя служба приложений Azure не является оркестратором, как удобная в использовании платформа контейнеров, она по-прежнему является подходящей альтернативой AKS.

Соображения по проектированию и рекомендации для службы приложений Azure

Для сценариев нагрузок на основе веб и API, App Service может быть альтернативой AKS. Она предоставляет платформу контейнеров с низким уровнем трения без сложности Kubernetes. Полный набор рекомендаций см. в статьях "Рекомендации по надежности для службы приложений" и "Операционное совершенство для службы приложений".

Надежность

Оцените использование портов TCP и SNAT. TCP-подключения используются для всех исходящих подключений. Порты SNAT используются для исходящих подключений к общедоступным IP-адресам. Исчерпание портов SNAT — это распространенный сценарий сбоя. Эту проблему следует прогнозировать путем нагрузочного тестирования при использовании Диагностика Azure для мониторинга портов. Если возникают ошибки SNAT, необходимо выполнить масштабирование через большее количество или более крупных рабочих узлов, или внедрить методы написания кода, способствующие сохранению и повторному использованию портов SNAT. Примеры методов написания кода, которые можно использовать, включают пул подключений и отложенную загрузку ресурсов.

Исчерпание TCP-порта — это еще один сценарий сбоя. Происходит, когда количество исходящих подключений из заданного рабочего узла превышает емкость. Количество доступных TCP-портов зависит от размера рабочей роли. См. рекомендации в разделе "Порты TCP и SNAT".

Масштабируемость

Планируйте будущие требования к масштабируемости и рост приложений, чтобы можно было применить соответствующие рекомендации с самого начала. Таким образом, вы можете избежать технической задолженности по мере развития решения.

Включите автомасштабирование, чтобы обеспечить доступность достаточных ресурсов для запросов на обслуживание. Оцените масштабирование для каждого приложения для высокоплотного размещения на Службе приложений.
Помните, что в App Service существует мягкое, обратимое ограничение на количество экземпляров в плане службы приложений.
Примените правила автомасштабирования. План службы приложений масштабируется быстрее, если выполняется любое правило в профиле, но только масштабируется медленнее, если выполняются все правила в профиле. Используйте комбинацию правил для масштабирования с увеличением и уменьшением, чтобы автоматическое масштабирование обеспечивало расширение и сжатие. Изучите поведение нескольких правил масштабирования в одном профиле.
Помните, что вы можете включить масштабирование для каждого приложения на уровне плана Служба приложений, чтобы позволить приложению масштабироваться независимо от плана Служба приложений, на котором он размещен. Приложения выделяются для доступных узлов с помощью оптимального подхода к равномерному распределению. Хотя равномерное распределение не гарантируется, платформа гарантирует, что два экземпляра одного приложения не размещаются на одном виртуальном сервере.

Наблюдение

Отслеживайте поведение приложения и получайте доступ к соответствующим журналам и метрикам, чтобы убедиться, что приложение работает должным образом.

Вы можете использовать диагностическую регистрацию для принятия журналов уровня приложения и платформы в Log Analytics, Azure Хранилище или сторонний инструмент через Azure Event Hubs.
Мониторинг производительности приложений с помощью Application Insights предоставляет подробные сведения о производительности приложений.
Критически важные приложения должны иметь возможность самовосстановляться, если возникают сбои. Включите Авто-восстановление для автоматического перезапуска неработоспособных рабочих процессов.
Необходимо использовать соответствующие проверки работоспособности для оценки всех критически важных взаимосвязей, что помогает обеспечить здоровье системы. Мы настоятельно рекомендуем включить проверку работоспособности для выявления неотзывчивых работников.

Развертывание

Для того чтобы обойти ограничение по умолчанию на количество экземпляров плана Службы приложений, разверните планы Службы приложений в нескольких единицах расширения масштаба в одном регионе. Разверните планы службы приложений в конфигурации доступности зоны, чтобы обеспечить распределение рабочих узлов между зонами в пределах региона. Рассмотрите возможность открытия запроса в службу поддержки, чтобы увеличить максимальное число сотрудников до удвоенного числа экземпляров, необходимого для обслуживания нормальной пиковой нагрузки.

Реестр контейнеров

Реестры контейнеров размещают образы, которые развертываются в средах выполнения контейнеров, таких как AKS. Необходимо тщательно настроить реестры контейнеров для критически важных рабочих нагрузок. Сбой не должен вызывать задержки при извлечении изображений, особенно во время операций масштабирования. Следующие соображения и рекомендации сосредоточены на Реестре контейнеров Azure и рассматривают компромиссы, которые связаны с централизованными и федеративными моделями развертывания.

Соображения и рекомендации по проектированию контейнерной регистрации Azure

Эта собственная служба предоставляет ряд функций, включая георепликацию, проверку подлинности Microsoft Entra, автоматическое создание контейнеров и исправление с помощью задач реестра контейнеров.

Надежность

Настройте георепликацию для всех регионов развертывания, чтобы удалить региональные зависимости и оптимизировать задержку. Реестр контейнеров поддерживает высокую доступность с помощью георепликации в нескольких настроенных регионах, обеспечивая устойчивость к региональным сбоям. Если регион становится недоступным, другие регионы продолжают обслуживать запросы изображений. Когда регион снова в сети, реестр контейнеров восстанавливает и реплицирует изменения в нём. Эта возможность также обеспечивает совместное размещение реестра в каждом настроенном регионе, уменьшая задержку сети и затраты на передачу данных между регионами.

В регионах Azure с поддержкой зон доступности, уровень Premium реестра контейнеров обеспечивает резервирование зон для защиты от зональных сбоев. Уровень "Премиум" также поддерживает частные конечные точки , чтобы предотвратить несанкционированный доступ к реестру, что может привести к проблемам надежности.

Размещайте образы вблизи вычислительных ресурсов, которые их потребляют, в тех же регионах Azure.

Блокировка изображений

Изображения могут быть удалены в результате, например, ошибки вручную. Реестр контейнеров поддерживает блокировку версии образа или хранилища, чтобы предотвратить изменения или удаление. При изменении на месте ранее развернутого изображения версии, развертывания с той же версией могут давать разные результаты до и после изменения.

Если вы хотите защитить экземпляр реестра контейнеров от удаления, используйте блокировки ресурсов.

Помеченные изображения

Образы реестра контейнеров, помеченные по умолчанию, изменяются, что означает, что один и тот же тег можно использовать для нескольких образов, отправленных в реестр. В рабочих сценариях это может привести к непредсказуемому поведению, которое может повлиять на время простоя приложения.

Управление удостоверениями и доступом

Используйте встроенную проверку подлинности Microsoft Entra для отправки и извлечения изображений вместо использования ключей доступа. Для повышения безопасности полностью отключите использование ключа доступа администратора.

Бессерверные вычисления

Бессерверные вычисления предоставляют ресурсы по запросу и устраняют необходимость управления инфраструктурой. Поставщик облачных служб автоматически подготавливает, масштабирует и управляет ресурсами, необходимыми для запуска развернутого кода приложения. Azure предоставляет несколько бессерверных вычислительных платформ:

Azure Functions. При использовании Azure Functions логика приложения реализуется в виде отдельных блоков кода, или функций, которые выполняются в ответ на события, такие как HTTP запрос или сообщение в очереди. Каждая функция масштабируется по мере необходимости для удовлетворения спроса.
Azure Logic Apps. Logic Apps лучше всего подходит для создания и запуска автоматизированных рабочих процессов, которые интегрируют различные приложения, источники данных, службы и системы. Как и Функции Azure, Logic Apps использует встроенные триггеры для обработки на основе событий. Однако вместо развертывания кода приложения можно создавать приложения логики с помощью графического пользовательского интерфейса, поддерживающего блоки кода, такие как условные и циклы.
Azure API Management. Вы можете использовать Управление API для публикации, преобразования, обслуживания и мониторинга API с повышенной безопасностью, используя уровень потребления.
Power Apps и Power Automate. Эти средства предоставляют возможности разработки с низким кодом или без кода с простой логикой рабочего процесса и интеграцией, которые можно настроить с помощью подключений в пользовательском интерфейсе.

Для критически важных приложений бессерверные технологии обеспечивают упрощенную разработку и операции, которые могут быть ценными для простых бизнес-вариантов использования. Однако эта простота обеспечивает гибкость с точки зрения масштабируемости, надежности и производительности, и это недоступно для большинства критически важных сценариев приложений.

В следующих разделах приведены рекомендации по проектированию и рекомендации по использованию Функции Azure и Logic Apps в качестве альтернативных платформ для некритических сценариев рабочих процессов.

Вопросы проектирования и рекомендации для функций Azure

Критически важные рабочие нагрузки имеют критически важные и некритичные системные потоки. Функции Azure — это жизнеспособный выбор потоков, которые не имеют одинаковых жестких бизнес-требований, что и критически важные системные потоки. Он хорошо подходит для потоков, управляемых событиями, которые имеют короткие процессы, так как функции выполняют различные операции, которые выполняются как можно быстрее.

Выберите вариант размещения Azure Functions, соответствующий уровню надежности приложения. Рекомендуется использовать план Premium, так как он позволяет настроить размер вычислительного экземпляра. Выделенный план является наименее бессерверным вариантом. Он обеспечивает автомасштабирование, но эти операции масштабирования медленнее, чем другие планы. Рекомендуется использовать план Premium для повышения надежности и производительности.

Существуют некоторые аспекты безопасности. При использовании триггера HTTP для предоставления внешней конечной точки используйте брандмауэр веб-приложения (WAF), чтобы обеспечить уровень защиты конечной точки HTTP от распространенных внешних векторов атак.

Мы рекомендуем использовать частные конечные точки для ограничения доступа к частным виртуальным сетям. Они также могут снизить риски кражи данных, такие как сценарии вредоносных администраторов.

Необходимо использовать средства сканирования кода в коде Azure Functions и интегрировать эти средства с конвейерами CI/CD.

Соображения и рекомендации по проектированию для Azure Logic Apps

Как и Функции Azure, Logic Apps использует встроенные триггеры для обработки на основе событий. Однако вместо развертывания кода приложения можно создавать приложения логики с помощью графического пользовательского интерфейса, который поддерживает такие блоки, как условные, циклы и другие конструкции.

Доступны несколько режимов развертывания. Мы рекомендуем стандартный режим, чтобы обеспечить развертывание с одним клиентом и устранить шумные сценарии соседей. В этом режиме используется контейнеризованная одноарендная среда выполнения Logic Apps, основанная на Azure Functions. В этом режиме логическое приложение может иметь несколько рабочих процессов с сохранением состояния и без сохранения состояния. Следует учитывать ограничения конфигурации.

Ограниченные миграции через IaaS

Многие приложения, имеющие локальные развертывания, используют технологии виртуализации и избыточное оборудование для обеспечения критически важных уровней надежности. Модернизация часто затрудняется из-за ограничений бизнеса, которые препятствуют полному соответствию основной архитектуре на основе облачных технологий (North Star), рекомендованной для критически важных рабочих задач. Поэтому многие приложения используют поэтапный подход с первоначальными облачными развертываниями с помощью виртуализации и Azure Виртуальные машины в качестве основной модели размещения приложений. Использование виртуальных машин инфраструктуры как службы (IaaS) может потребоваться в определенных сценариях.

Доступные службы PaaS не обеспечивают необходимую производительность или уровень управления.
Для рабочей нагрузки требуется доступ к операционной системе, определенные драйверы или конфигурации сети и системы.
Рабочая нагрузка не поддерживает выполнение в контейнерах.
Поддержка сторонних рабочих нагрузок со стороны поставщика отсутствует.

В этом разделе рассматриваются лучшие способы использования Виртуальные машины и связанных служб для повышения надежности платформы приложений. В ней рассматриваются ключевые аспекты методологии проектирования, критически важной для трансформации сценариев миграции облачно-ориентированных и IaaS.

Следующий шаг

Ознакомьтесь с рекомендациями по платформе данных.

Платформа данных

Поделиться через

Рекомендации по платформе приложений для критически важных рабочих нагрузок в Azure

Глобальное распределение ресурсов платформы

Рекомендации по проектированию

Рекомендации по проектированию

Контейнеризация

Рекомендации по проектированию

Рекомендации по проектированию

Размещение контейнеров и оркестрация

Рекомендации и аспекты проектирования для службы Azure Kubernetes

Надежность

Масштабируемость

Изоляция

Безопасность

Обновления

Сеть

Наблюдение

Система управления

Соображения по проектированию и рекомендации для службы приложений Azure

Надежность

Масштабируемость

Наблюдение

Развертывание

Реестр контейнеров

Рекомендации по проектированию

Рекомендации по проектированию

Соображения и рекомендации по проектированию контейнерной регистрации Azure

Надежность

Блокировка изображений

Помеченные изображения

Управление удостоверениями и доступом

Бессерверные вычисления

Вопросы проектирования и рекомендации для функций Azure

Соображения и рекомендации по проектированию для Azure Logic Apps

Ограниченные миграции через IaaS

Рекомендации по проектированию

Рекомендации по проектированию

Следующий шаг

Обратная связь

Дополнительные ресурсы