Изучение архитектуры решения

Завершено

Прежде чем приступить к работе, давайте рассмотрим архитектуру, чтобы понять все требования. Перенос модели в рабочую среду означает, что необходимо масштабировать решение и работать вместе с другими командами. Вместе со специалистами по обработке и анализу данных, инженерами данных и командой по инфраструктуре вы решили использовать следующий подход:

  • Все данные будут храниться в Хранилище BLOB-объектов Azure, которыми будет управлять инженер данных.
  • Команда инфраструктуры создаст необходимые ресурсы Azure, такие как рабочая область Машинного обучения Azure.
  • Специалист по обработке и анализу данных сосредоточится на внутреннем цикле: разработке и обучении модели.
  • Инженер по машинному обучению развернет обученную модель во внешнем цикле.

Вместе с большой командой вы разработали архитектуру для реализации подхода MLOps.

Схема архитектуры операций машинного обучения.

Примечание.

На схеме демонстрируется упрощенное представление архитектуры MLOps. Чтобы просмотреть архитектуру более подробно, изучите различные варианты использования в акселераторе решений MLOps (версии 2).

Основной целью архитектуры MLOps является создание надежного и воспроизводимого решения. Этапы создания такой архитектуры:

  1. Настройка: создание всех необходимых ресурсов Azure для решения.
  2. Разработка моделей (внутренний цикл): изучение и обработка данных для обучения и оценки модели.
  3. Непрерывная интеграция: упаковка и регистрация модели.
  4. Развертывание модели (внешний цикл): развертывание модели.
  5. Непрерывное развертывание: тестирование модели и перенос в рабочую среду.
  6. Мониторинг: мониторинг производительности модели и конечной точки.

На этом этапе проекта создается рабочая область Машинного обучения Azure, данные хранятся в Хранилище BLOB-объектов Azure, а команда по обработке и анализу данных обучила модель.

Вы хотите перейти от внутреннего цикла и разработки модели к внешнему циклу, развернув модель в рабочей среде. Поэтому необходимо преобразовать выходные данные команды по обработке и анализу данных в надежный и воспроизводимый конвейер в Машинном обучении Azure.

Если весь код будет храниться в виде скриптов, а скрипты будут выполняться в виде заданий Машинного обучения Azure, вы упростите автоматизацию обучения модели и переобучение модели в будущем.

Схема: детали развертывания модели на основе настройки.

Команда по обработке и анализу данных работает над разработкой моделей. Они предоставляют записную книжку Jupyter, которая включает следующие задачи:

  1. Чтение и изучение данных.
  2. Выполните проектирование функций.
  3. Обучение модели.
  4. Оценка модели.

В ходе настройки команда по инфраструктуре создала следующие компоненты:

  1. Рабочая область разработки Машинного обучения Azure, которую может использовать команда по обработке и анализу данных для исследования и экспериментирования.
  2. Ресурс данных в рабочей области, который ссылается на папку в Хранилище BLOB-объектов Azure, содержащей данные.
  3. Вычислительные ресурсы, необходимые для запуска записных книжек и сценариев.

Ваш первый шаг в направлении MLOps — преобразовать работу специалистов по обработке и анализу данных, чтобы можно было легко автоматизировать разработку моделей. Пока команда по обработке и анализу данных работает в записной книжке Jupyter, вы должны выполнять скрипты с помощью заданий Машинного обучения Azure. Входные данные задания будут ресурсом данных, созданным командой по инфраструктуре, который указывает на данные, находящиеся в Хранилище BLOB-объектов Azure, подключенном к рабочей области Машинного обучения Azure.