Введение

3 мин

В машинном обучении модели обучаются прогнозировать неизвестные метки для новых данных на основе корреляций между известными метками и функциями, обнаруженными в обучающих данных. В зависимости от используемого алгоритма может потребоваться указать гиперпараметры для настройки способа обучения модели.

Например, алгоритм логистической регрессии использует гиперпараметр коэффициента регуляризации, чтобы избежать чрезмерной подгонки. А методы глубокого обучения для сверточных нейронных сетей (CNN) используют такие гиперпараметры, как скорость обучения для управления весовыми коэффициентами во время обучения и размер пакета для определения количества элементов данных, включаемых в каждый пакет обучения.

Примечание.

Машинное обучение — это научная область с собственной специальной терминологией. Специалисты по обработке и анализу данных называют значения, определенные на основе обучающих функций, параметрами, поэтому для значений, используемых для настройки режима обучения, но *не являющихся производными от обучающих данных, требуется отдельный термин, что и привело к появлению термина гиперпараметр.

Выбор значений параметров может существенно повлиять на итоговую модель. Так что важно выбирать лучшие значения для конкретных данных и целевых показателей прогнозирования.

Настройка гиперпараметров

Diagram of different hyperparameter values resulting in different models by performing hyperparameter tuning.

Настройка гиперпараметра выполняется путем обучения нескольких моделей с использованием одного алгоритма и обучающих данных, но различных значений гиперпараметров. Затем полученные модели из каждого учебного запуска оцениваются, чтобы определить метрику производительности, для которой необходимо выполнить оптимизацию (например, точность), и выбирается наилучшая для этого модель.

В Машинное обучение Azure можно настроить гиперпараметры, отправив скрипт в качестве задания очистки. Задание очистки будет запускать пробную версию для каждого сочетания гиперпараметров для тестирования. Каждая пробная версия использует скрипт обучения с параметризованными значениями гиперпараметров для обучения модели и регистрирует целевую метрику производительности, достигнутую обученной моделью.

Цели обучения

В этом модуле рассматриваются следующие задачи:

Определение пространства поиска гиперпараметров.
Настройка выборки гиперпараметров.
Выбор политики раннего завершения.
Выполнение задания очистки.

Введение

Настройка гиперпараметров

Цели обучения

Обратная связь