Определение ресурсов Машинное обучение Azure

Завершено

В основном вы работаете с ресурсами в рабочей области Машинное обучение Azure. Ресурсы создаются и используются на различных этапах проекта и включают:

  • Модели
  • Среды
  • Data
  • Компоненты

Создание моделей и управление ими

Конечный продукт обучения модели — это сама модель. Вы можете обучать модели машинного обучения с помощью различных платформ, таких как Scikit-learn или PyTorch. Распространенный способ хранения таких моделей — упаковать модель как файл выбора Python (.pkl расширение).

Кроме того, можно использовать MLflow платформы с открытым исходным кодом для хранения модели в формате MLModel.

Независимо от выбранного формата двоичные файлы представляют модель и все соответствующие метаданные. Чтобы сохранить эти файлы, можно создать или зарегистрировать модель в рабочей области.

При создании модели в рабочей области укажите имя и версию. Особенно полезно при развертывании зарегистрированной модели управление версиями позволяет отслеживать конкретную модель, которую вы хотите использовать.

Создание сред и управление ими

При работе с облачными вычислениями важно убедиться, что код выполняется на любых вычислительных ресурсах, доступных для вас. Независимо от того, следует ли запускать скрипт в вычислительном экземпляре или вычислительном кластере, код должен выполняться успешно.

Представьте, что вы работаете в Python или R, используя платформы с открытым исходным кодом для обучения модели на локальном устройстве. Если вы хотите использовать библиотеку, например Scikit-learn или PyTorch, необходимо установить ее на устройстве.

Аналогичным образом при написании кода, использующего любые платформы или библиотеки, необходимо убедиться, что необходимые зависимости устанавливаются на вычислительные ресурсы, выполняющие код. Чтобы указать все необходимые требования, можно создавать среды. При создании среды необходимо указать имя и версию.

Среды указывают пакеты программного обеспечения, переменные среды и параметры программного обеспечения для выполнения скриптов. Среда хранится в виде образа в Реестр контейнеров Azure, созданной с рабочей областью при первом использовании.

При каждом запуске скрипта можно указать среду, которая должна использоваться целевым объектом вычислений. Среда устанавливает все необходимые требования к вычислительным ресурсам перед выполнением скрипта, что делает код надежным и повторно используемым в целевых объектах вычислений.

Создание данных и управление ими

В то время как хранилища данных содержат сведения о подключении к службам хранилища данных Azure, ресурсы данных ссылаются на определенный файл или папку.

Ресурсы данных можно использовать для легкого доступа к данным каждый раз, не предоставляя проверку подлинности каждый раз, когда вы хотите получить к ней доступ.

При создании ресурса данных в рабочей области укажите путь, указывающий на файл или папку, а также имя и версию.

Создание компонентов и управление ими

Для обучения моделей машинного обучения необходимо написать код. В проектах можно использовать код, который можно использовать повторно. Вместо написания кода с нуля необходимо повторно использовать фрагменты кода из других проектов.

Чтобы упростить общий доступ к коду, можно создать компонент в рабочей области. Чтобы создать компонент, необходимо указать имя, версию, код и среду, необходимую для запуска кода.

При создании конвейеров можно использовать компоненты. Поэтому компонент часто представляет шаг в конвейере, например для нормализации данных, обучения модели регрессии или тестирования обученной модели в наборе данных проверки.