Поделиться через


Двухклассовая байесовская точечная машина

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

Создает модель двоичной классификации байесовской точечной машины.

категория: Машинное обучение/инициализация модели или классификации

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Обзор модуля

в этой статье описывается, как использовать модуль многоклассового компьютера с алгоритмом байеса в Машинное обучение Studio (классическая модель) для создания модели обученной двоичной классификации.

Алгоритм в этом модуле использует Байеса подход к линейной классификации, называемой "автоматом для алгоритма Байеса". Этот алгоритм эффективно приближен к теоретическому оптимальному Байеса усреднения линейных классификаторов (с точки зрения производительности обобщения), выбрав один "средний" классификатор, точку алгоритма Байеса. Так как байесовская точечная машина — это байесовская модель классификации, в ней не могут возникать лжевзаимосвязи с данными для обучения.

дополнительные сведения см. в статье запись крис bishop) в блоге Microsoft Машинное обучение: принятие неопределенного вероятностнаяного вывода.

Настройка компьютера с точкой Байеса Two-Class

  1. в Машинное обучение Studio (классическая модель) добавьте в эксперимент модуль байеса с двумя классами . модуль можно найти в разделе Машинное обучение, инициализация модели, классификация.

  2. Для количества итераций обучениявведите число, которое указывает, как часто алгоритм передачи сообщений проходит по обучающим данным. Как правило, количество итераций задается в диапазоне от 5 до 100.

    Чем больше число итераций обучения, тем точнее прогнозы, однако обучение происходит медленнее.

    Для большинства наборов данных достаточно числа итераций по умолчанию (30). Оно позволяет алгоритму получать точные прогнозы. Иногда точные прогнозы можно сделать с помощью меньшего числа итераций. Вы можете улучшить результат для наборов данных с высокой корреляцией признаков за счет использования большого количества итераций обучения.

  3. Выберите параметр включить смещение, если требуется добавить постоянную функцию или уровень смещения в каждый экземпляр в обучении и прогнозировании.

    Добавить смещение необходимо, если данные не содержат постоянный признак.

  4. Выберите параметр Разрешить неизвестные значения в функциях категорий, чтобы создать группу для неизвестных значений.

    Если этот параметр отключить, модель сможет принимать только значения, содержащиеся в данных для обучения.

    Если выбран этот параметр и разрешены неизвестные значения, модель может быть менее точной для известных значений, но она может предоставлять лучшие прогнозы для новых (неизвестных) значений.

  5. Добавьте экземпляр модуля обучение модели и обучающие данные.

  6. Подключение обучающие данные и выход из модуля байеса с двумя классами в модуль обучение модели и выберите столбец метка.

  7. Запустите эксперимент.

Результаты

После завершения обучения щелкните правой кнопкой мыши выходные данные модуля обучение модели , чтобы просмотреть результаты.

  • Чтобы просмотреть сводку параметров модели, а также весовые коэффициенты функций, полученные в ходе обучения, выберите визуализировать.

  • Чтобы сохранить модель для последующего использования, щелкните правой кнопкой мыши выходные данные « обучение модели» и выберите « Сохранить как обученную модель».

  • Чтобы сделать прогнозы, используйте обученную модель в качестве входных данных для модуля Оценка модели .

    Обученная модель также может быть передана в перекрестную проверку модели для перекрестной проверки по отношению к помеченному набору данных.

Примеры

Чтобы узнать, как в машинном обучении используется компьютер с точкой Байеса Two-Class, ознакомьтесь с примерами экспериментов в Коллекция решений ии Azure.

Технические примечания

Этот раздел содержит сведения о реализации и часто задаваемые вопросы об этом алгоритме.

В этом документе (PDF) доступны сведения из исходной и лежащей в основе теории: компьютеры с точкой Байеса, по проведенное, граепе и Кэмпбелл (

Однако эта реализация улучшает исходный алгоритм несколькими способами:

Эти усовершенствования повышают надежность байесовской точечной машины и делают ее проще в использовании. При этом вы можете пропустить отнимающую много времени настройку параметров.

Параметры модуля

Имя Диапазон Тип По умолчанию Описание
Число итераций обучения >= 1 Целое число 30 Укажите число итераций для обучения
Включить смещение Любой Логическое значение True Укажите, следует ли добавить постоянный признак или смещение для каждого экземпляра
Разрешить неизвестные значения для категориальных признаков Любой Логическое значение True Если значение равно True, создается дополнительный уровень для каждого категориального столбца. Все уровни в тестовом наборе данных, недоступные в обучающем наборе, сопоставляются с этим дополнительным уровнем.

Выходные данные

Имя Тип Описание
Необученная модель Интерфейс ILearner Необученная модель бинарной классификации

См. также раздел

Список модулей класса A-Z