Политика обучения и настройки
Внимание
Начиная с 20 сентября 2023 г. вы не сможете создавать новые ресурсы Персонализатора. Служба Персонализатора отменяется 1 октября 2026 года.
Настройки обучения определяют гиперпараметры обучения модели. Две модели одних и тех же данных, которые обучаются в разных условиях обучения, в конечном итоге будут разными.
Политика обучения и параметры задаются в вашем ресурсе Персонализатора на портале Azure.
Импорт и экспорт политик обучения
Вы можете импортировать и экспортировать файлы политики обучения с портала Azure. Используйте этот метод для сохранения существующих политик, их тестирования, замены и архивации в вашем элементе управления исходным кодом в качестве артефактов для дальнейшего использования и аудита.
Узнайте, как импортировать и экспортировать политику обучения на портале Azure для вашего ресурса Персонализатора.
Понять настройки политики обучения
Параметры политики обучения не подлежат изменению. Изменяйте настройки, только если вы понимаете, как они влияют на Персонализатор. Без этого знания вы можете вызвать проблемы, в том числе сделать недействительными модели Персонализатора.
Персонализатор использует vowpalwabbit для обучения и оценки событий. Обратитесь к документации vowpalwabbit о том, как редактировать настройки обучения с помощью vowpalwabbit. Получив правильные аргументы командной строки, сохраните команду в файл следующего формата (замените значение свойства arguments на нужную команду) и загрузите файл для импорта параметров обучения на панели параметров модели и обучения на портале Azure для ваш ресурс Персонализатора.
Ниже представлен пример .json
списка строк.
{
"name": "new learning settings",
"arguments": " --cb_explore_adf --epsilon 0.2 --power_t 0 -l 0.001 --cb_type mtr -q ::"
}
Сравните правила обучения
Вы можете сравнить эффективность различных политик обучения с прошлыми данными в журналах Персонализатора, выполнив автономные оценки.
Загрузите свою собственную политику обучения, чтобы сравнить ее с текущей политикой обучения.
Оптимизировать политику обучения
Персонализатор может создать оптимизированную политику обучения при автономной оценке. Оптимизированная политика обучения, которая дает больше вознаграждений при автономном оценивании, даст лучшие результаты при использовании в Интернете в Персонализаторе.
После оптимизации политики обучения вы можете применить ее непосредственно к Персонализатору, чтобы она немедленно заменила текущую политику. Или вы можете сохранить оптимизированную политику для дальнейшей оценки, а затем решить, следует ли ее отбросить, сохранить или применить.
Следующие шаги
- Узнавайте активные и неактивные события.