Поделиться через


Изучение модели упрощенного алгоритма Байеса (учебник по интеллектуальному анализу данных — начальный уровень)

Упрощенный алгоритм Байеса (Майкрософт) предоставляет несколько методов для отображения взаимодействия между покупкой велосипедов и входными атрибутами.

Средство просмотра Упрощенного байеса (Майкрософт) предоставляет следующие вкладки для изучения моделей интеллектуального анализа данных Наивного Байеса:

Сеть зависимостей

Вкладка Сеть зависимостей работает так же, как и вкладка Сеть зависимостей для Средства просмотра деревьев (Майкрософт). Каждый из узлов в средстве просмотра отображает атрибут, а линии между узлами представляют связи. В средстве просмотра показаны все атрибуты, влияющие на состояние прогнозируемого атрибута «Покупатель велосипеда».

Исследование модели на вкладке «Сеть зависимостей»

  1. Используйте список Модель интеллектуального анализа данных в верхней части вкладки Средство просмотра моделей интеллектуального анализа данных, чтобы переключиться на TM_NaiveBayes модель.

  2. Используйте список Средства просмотра для перехода на упрощенное средство просмотра Байеса (Майкрософт).

  3. Bike Buyer Щелкните узел, чтобы определить его зависимости.

    Розовая заливка указывает на то, что все атрибуты влияют на покупку велосипедов.

  4. Определите с помощью ползунка атрибут, оказывающий наибольшее влияние.

    По мере перемещения ползунка вниз остаются только атрибуты, оказывающие наибольшее влияние на столбец [Покупатель велосипеда]. Регулировка ползунка поможет выяснить, что наибольшее значение имеют такие атрибуты, как число автомобилей во владении, расстояние до работы и общее количество детей.

Профили атрибутов

На вкладке Профили атрибутов описывается, как различные состояния входных атрибутов влияют на результат прогнозируемого атрибута.

Исследование модели на вкладке «Профили атрибутов»

  1. Убедитесь, что Bike Buyer в поле Прогнозируемо выбрано значение .

  2. Если условные обозначения интеллектуального анализа данных блокируют отображение профилей атрибутов, переместите его с пути.

  3. В поле Гистограмма гистограммы выберите 5.

    В нашей модели значение 5 — это максимальное количество состояний для любой одной переменной.

    Атрибуты, влияющие на состояние данного прогнозируемого атрибута, перечисляются вместе со значениями каждого состояния входных атрибутов и их распределениями по каждому состоянию прогнозируемого атрибута.

  4. В столбце Атрибуты найдите Число автомобилей, принадлежащих. Обратите внимание на различия в гистограммах для покупателей велосипедов (столбец с меткой 1) и тех, кто не покупает (столбец с меткой 0). Человек, у которого есть один автомобиль или вообще нет машины, является наиболее вероятным покупателем велосипеда.

  5. Дважды щелкните ячейку Number Cars Owned (Number Cars Owned ) в столбце покупателя велосипеда (столбец с меткой 1).

    В условных обозначениях интеллектуального анализа данных отображается более подробное представление.

Характеристики атрибута

На вкладке Характеристики атрибута можно выбрать атрибут и значение, чтобы узнать, как часто значения для других атрибутов отображаются в выбранных вариантах значений.

Исследование модели на вкладке «Характеристики атрибута»

  1. Убедитесь, что Bike Buyer в списке Атрибут выбрано значение .

  2. Задайте для параметра Значениезначение 1.

    В средстве просмотра будут показано, что заказчики, которые не имеют проживающих с ними детей, работают недалеко от дома и живут в Североамериканском регионе, являются более вероятными покупателями велосипеда.

Сравнение атрибутов

На вкладке Распознавание атрибутов можно исследовать связь между двумя дискретными значениями покупки велосипедов и другими значениями атрибутов. TM_NaiveBayes Так как модель имеет только два состояния, 1 и 0, вам не нужно вносить какие-либо изменения в средство просмотра.

В средстве просмотра показано, что велосипеды, как правило, покупают люди, не имеющие в распоряжении машин, и наоборот, люди, имеющие две машины, большей частью велосипеды не покупают.

Дополнительные сведения о других моделях интеллектуального анализа данных см. в следующих разделах.

Следующее занятие

Урок 5. Тестирование моделей (учебник по базовому интеллектуальному анализу данных)

Предыдущая задача занятия

Изучение модели кластеризации (учебник по интеллектуальному анализу данных — начальный уровень)

См. также:

Просмотр модели с помощью средства просмотра упрощенного алгоритма Байеса (Майкрософт)
Вкладка «Сравнение атрибутов» (средство просмотра моделей интеллектуального анализа данных)
Вкладка «Профили атрибутов» (средство просмотра моделей интеллектуального анализа данных)
Вкладка «Характеристики атрибутов» (средство просмотра моделей интеллектуального анализа данных)
Вкладка «Сеть зависимостей» (средство просмотра моделей интеллектуального анализа данных)