Двухклассовое усредненное восприятие
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
Создает модель двоичной классификации усредненного перцептрона.
категория: Машинное обучение/инициализация модели или классификации
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Обзор модуля
в этой статье описывается, как с помощью Машинное обучение перцептрона Studio (классической) создать модель машинного обучения, основанную на алгоритме среднего перцептрона.
Этот алгоритм классификации относится к контролируемым методам обучения и требует наличия набора данных с тегами, то есть с метками в отдельном столбце. Вы можете обучить модель, предоставив модель и набор данных с тегами в качестве входных данных для обучения модели или настройки параметров модели. Обученную модель затем можно использовать для прогнозирования значений на основе новых примеров входных данных.
Дополнительные сведения о средних моделях перцептрона
Усредненный метод перцептрона является ранней и очень простой версией нейронной сети. В этом подходе входные данные делятся на несколько возможных значений на основе линейной функций в сочетании с набором весовых коэффициентов, производным от вектора компонента, отсюда и название "перцептрон".
Более простые модели перцептрона подходят для обучения линейно отделяемых шаблонов, тогда как нейронные сети (особенно глубокие нейронные сети) могут моделировать более сложные границы класса. Однако перцептроны работают быстрее, и их можно использовать в непрерывном обучении, так как перцептроны обрабатывают случаи последовательно.
Настройка модуля "Двухклассовый усредненный перцептрон"
Добавьте модуль перцептрона, основанный на двух классах , к эксперименту в студии (классическая модель).
Укажите, как вы хотите обучать модель, выбрав значение Create trainer mode (Создать режим учителя).
Single Parameter (Одиночный параметр). Если вы знаете, как хотите настроить модель, предоставьте определенный набор значений в качестве аргументов.
Диапазон параметров. Если вы не знаете наилучших параметров, найдите оптимальные параметры, указав несколько значений и используя модуль настройки параметров модели , чтобы найти оптимальную конфигурацию. Преподаватель выполняет перебор нескольких сочетаний указанных вами параметров и определяет сочетание значений, которые создают лучшую модель.
В параметре Скорость обучения укажите значение скорости обучения. Значения скорости обучения контролируют размер шага, который используется в вероятностном градиентном спуске при каждом тестировании и изменении модели.
При увеличении скорости модель тестируется чаще, но появляется риск застрять на локальном уровне. При увеличении шага схождение будет выполняться быстрее, но появляется риск превышения истинного минимума.
В параметре Maximum number of iterations (Максимальное число итераций) укажите, сколько раз алгоритм должен проверить учебные данные.
Ранняя остановка часто обеспечивает лучшее обобщение. При повышении количества итераций улучшается подгонка, но при этом появляется риск возникновения лжевзаимосвязей.
В параметре Random number seed (Случайное начальное значение) введите необязательное значение в формате целого числа, которое будет использоваться в качестве начального значения. Рекомендуется использовать начальное значение, если вы хотите обеспечить воспроизводимость эксперимента между выполнениями.
Установите флажок Разрешить неизвестные уровни категорий , чтобы создать группу для неизвестных значений в обучающих и проверочных наборах. В этом случае модель может быть менее точной для известных значений, но она обеспечивает более точные прогнозы для новых (неизвестных) значений.
Если этот параметр отключить, модель сможет принимать только значения, содержащиеся в данных для обучения.
Подключение набор данных для обучения и один из обучающих модулей:
Если для параметра Создать режим учителя задано значение Одиночный параметр, используйте модуль Обучение модели.
Если для параметра Создать режим учителя задано значение Диапазон параметров, используйте модуль Настройка гиперпараметров модели.
Примечание
При передаче диапазона параметров в модуль Обучение модели используется только первое значение в списке диапазона параметров.
Если передать один набор значений параметров в модуль Настройка гиперпараметров модели, когда он ожидает диапазон параметров для каждого параметра, он пропускает значения и использует значения по умолчанию для ученика.
Если выбран вариант Parameter Range (Диапазон параметров) и указано одно значение для любого параметра, это единственное заданное значение будет использоваться во время очистки, даже если другие параметры меняются в диапазоне значений.
Результаты
После завершения обучения:
- Чтобы просмотреть сводку по параметрам модели вместе с весовыми коэффициентами функций, полученными в ходе обучения, щелкните правой кнопкой мыши выходные данные « обучение модели » или « Настройка модели».
Примеры
Примеры использования этого алгоритма обучения см. в Коллекция решений ии Azure:
- Перекрестная проверка для примера двоичных классификаторов: сравнивает несколько моделей классификации.
Технические примечания
В этом разделе содержатся сведения о реализации, советы и ответы на часто задаваемые вопросы.
Советы по использованию
Для этого типа модели рекомендуется нормализовать наборы данных перед использованием их для обучения классификатора. Параметры нормализации см. в разделе нормализация данных.
Модель усредненного перцептрона представляет собой раннюю и упрощенная версию нейронных сетей. Являясь таковой, она отлично подходит для простых наборов данных в случаях, когда главным приоритетом является скорость, а не точность. Однако если вы не получаете нужные результаты, попробуйте одну из следующих моделей:
Нейронная сеть с двумя классами или Многоклассовая нейронная сеть
Логистическая регрессия или Многоклассовая логистическая регрессия с двумя классами
Two-Class Boosted Decision Tree (Двухклассовое увеличивающееся дерево принятия решений);
Параметры модуля
Имя | Диапазон | Тип | По умолчанию | Описание |
---|---|---|---|---|
Скорость обучения | >= double.Epsilon | Float | 1,0 | Начальная скорость обучения для оптимизатора понижения стохастического градиента. |
Максимальное число итераций | >= 1 | Целое число | 10 | Число итераций понижения стохастического градиента, которое необходимо выполнить над обучающим набором данных. |
Начальное значение случайного числа | Любой | Целое число | Начальное значение для генератора случайных чисел, используемого моделью. Чтобы использовать значение по умолчанию, оставьте это поле пустым. | |
Разрешить неизвестные категориальные уровни | Любой | Логическое значение | True | Если значение равно True, создается дополнительный уровень для каждого категориального столбца. Все уровни в тестовом наборе данных, недоступные в обучающем наборе, сопоставляются с этим дополнительным уровнем. |
Выходные данные
Имя | Тип | Описание |
---|---|---|
Необученная модель | Интерфейс ILearner | Обученная модель двоичной классификации, которая может быть подключена к модулям модели Многоклассовый классификатор "один — все", обучение моделиили перекрестной проверки . |