Введение
В машинном обучении модели обучаются прогнозировать неизвестные метки для новых данных на основе корреляций между известными метками и функциями, обнаруженными в обучающих данных. В зависимости от используемого алгоритма может потребоваться указать гиперпараметры для настройки способа обучения модели.
Например, алгоритм логистической регрессии использует гиперпараметр коэффициента регуляризации, чтобы избежать чрезмерной подгонки. А методы глубокого обучения для сверточных нейронных сетей (CNN) используют такие гиперпараметры, как скорость обучения для управления весовыми коэффициентами во время обучения и размер пакета для определения количества элементов данных, включаемых в каждый пакет обучения.
Примечание.
Машинное обучение — это научная область с собственной специальной терминологией. Специалисты по обработке и анализу данных называют значения, определенные на основе обучающих функций, параметрами, поэтому для значений, используемых для настройки режима обучения, но *не являющихся производными от обучающих данных, требуется отдельный термин, что и привело к появлению термина гиперпараметр.
Выбор значений параметров может существенно повлиять на итоговую модель. Так что важно выбирать лучшие значения для конкретных данных и целевых показателей прогнозирования.
Настройка гиперпараметров
Настройка гиперпараметра выполняется путем обучения нескольких моделей с использованием одного алгоритма и обучающих данных, но различных значений гиперпараметров. Затем полученные модели из каждого учебного запуска оцениваются, чтобы определить метрику производительности, для которой необходимо выполнить оптимизацию (например, точность), и выбирается наилучшая для этого модель.
В Машинное обучение Azure можно настроить гиперпараметры, отправив скрипт в качестве задания очистки. Задание очистки будет запускать пробную версию для каждого сочетания гиперпараметров для тестирования. Каждая пробная версия использует скрипт обучения с параметризованными значениями гиперпараметров для обучения модели и регистрирует целевую метрику производительности, достигнутую обученной моделью.
Цели обучения
В этом модуле рассматриваются следующие задачи:
- Определение пространства поиска гиперпараметров.
- Настройка выборки гиперпараметров.
- Выбор политики раннего завершения.
- Выполнение задания очистки.