Поделиться через


Что такое автоматизированное машинное обучение (AutoML)?

Автоматизированное машинное обучение (AutoML) автоматизирует процесс применения машинного обучения к данным. Учитывая набор данных, можно запустить AutoML, чтобы выполнять итерацию по различным преобразованиям данных, алгоритмам машинного обучения и гиперпараметрам, чтобы выбрать лучшую модель.

Заметка

Эта статья относится к API AutoML ML.NET, который в настоящее время находится в предварительной версии. Материал подлежит изменению.

Как работает AutoML?

Как правило, рабочий процесс для обучения моделей машинного обучения выглядит следующим образом:

  • Определение проблемы
  • Сбор данных
  • Предварительная обработка данных
  • Обучение модели
  • Оценка модели

Традиционный рабочий процесс обучения в ML и AutoML

Предварительная обработка, обучение и оценка — это экспериментальный и итеративный процесс, который требует нескольких испытаний, пока вы не достигнете удовлетворительных результатов. Так как эти задачи, как правило, повторяются, AutoML может помочь автоматизировать эти шаги. Помимо автоматизации, методы оптимизации используются во время процесса обучения и оценки для поиска и выбора алгоритмов и гиперпараметров.

Когда следует использовать AutoML?

Независимо от того, как вы только начинаете работу с машинным обучением или вы опытный пользователь, AutoML предоставляет решения для автоматизации процесса разработки моделей.

  • начинающих. Если вы не знакомы с машинным обучением, AutoML упрощает процесс разработки моделей, предоставляя набор стандартных значений, что снижает количество решений, которые необходимо принять при обучении модели. При этом вы можете сосредоточиться на данных и проблеме, которую вы пытаетесь решить и позволить AutoML выполнять остальные действия.
  • опытные пользователи. Если у вас есть опыт работы с машинным обучением, вы можете настроить, настроить и расширить значения по умолчанию, предоставляемые AutoML на основе ваших потребностей, при этом используя возможности автоматизации.

AutoML в ML.NET

  • Featurizer — удобный API для автоматизации предварительной обработки данных.
  • пробной версии — один запуск оптимизации гиперпараметров.
  • Эксперимент — коллекция пробных версий AutoML. ML.NET предоставляет высокоуровневый API для создания экспериментов, которые устанавливают значения по умолчанию для индивидуальных компонентов Sweepable Pipeline, пространства поиска и средства настройки.
  • пространство поиска — диапазон доступных вариантов выбора гиперпараметров.
  • - алгоритмы, используемые для оптимизации гиперпараметров. ML.NET поддерживает следующие настройщики:
    • Затраты Frugal Tuner — реализация фругальной оптимизации для гиперпараметров, связанных с затратами, принимая во внимание затраты на обучение
    • Eci Cost Frugal Tuner — реализация экономного тюнера затрат для иерархических поисковых пространств. Тюнер по умолчанию, используемый AutoML.
    • SMAC — оптимизатор, использующий случайные леса для байесовской оптимизации.
    • Поиск по сетке — тюнер, который лучше всего подходит для небольших пространств поиска.
    • Случайный поиск
  • Эстиматор с возможностью настройки — оценщик ML.NET, содержащий пространство поиска.
  • ML.NET-конвейер с возможностью подбора параметров — ML.NET-конвейер, содержащий один или несколько оценщиков с возможностью подбора параметров.
  • Trial Runner — компонент AutoML, использующий настраиваемые конвейеры и настройки испытаний для создания результатов испытаний из обучения и оценки моделей.

Для начинающих рекомендуется начать с значений по умолчанию, предоставляемых API экспериментов высокого уровня. Для более опытных пользователей, ищущих варианты настройки, используйте настраиваемые компоненты, такие как масштабируемый конвейер, пространство поиска, средство выполнения экспериментов и модули настройки.

Дополнительные сведения о начале работы с API AutoML см. в руководстве по ML.NET API автоматического машинного обучения (AutoML).

Поддерживаемые задачи

AutoML предоставляет предварительно настроенные значения по умолчанию для следующих задач:

  • Двоичная классификация
  • Многоклассовая классификация
  • Регрессия

Для других задач можно создать собственный модуль выполнения пробной версии, чтобы включить эти сценарии. Дополнительные сведения см. в руководстве по использованию API автоматизированного машинного обучения (AutoML) в ML.NET.

Дальнейшие действия