Изучение модели упрощенного алгоритма Байеса (учебник по интеллектуальному анализу данных — начальный уровень)
Упрощенный алгоритм Байеса Microsoft предусматривает несколько способов отображения взаимосвязи между покупкой велосипедов и входными атрибутами.
Средство просмотра упрощенного алгоритма Байеса Microsoft содержит следующие вкладки для обзора моделей интеллектуального анализа данных упрощенных алгоритмов Байеса:
Сеть зависимостей
Профили атрибутов
Характеристики атрибута
Сравнение атрибутов
Следующие разделы посвящены исследованию других моделей интеллектуального анализа данных.
Сеть зависимостей
Вкладка Сеть зависимостей работает точно так же, как и вкладка Сеть зависимостей средства просмотра деревьев (Майкрософт). Каждый из узлов в средстве просмотра отображает атрибут, а линии между узлами представляют связи. В средстве просмотра показаны все атрибуты, влияющие на состояние прогнозируемого атрибута Bike Buyer.
Исследование модели на вкладке «Сеть зависимостей»
Выберите модель TM_NaiveBayes в списке Модель интеллектуального анализа данных в верхней части вкладки Средство просмотра моделей интеллектуального анализа данных.
Используйте список Средство просмотра, чтобы переключиться в Средство просмотра упрощенного алгоритма Байеса (Майкрософт).
Щелкните узел Покупатель велосипеда для определения его зависимостей.
Розовая заливка указывает на то, что все атрибуты влияют на покупку велосипедов.
Определите с помощью ползунка атрибут, оказывающий наибольшее влияние.
По мере перемещения ползунка вниз остаются только атрибуты, оказывающие наибольшее влияние на столбец [Bike Buyer]. Перемещая ползунок, можно узнать, что несколькими атрибутами, оказывающими наибольшее влияние, являются число имеющихся в распоряжении автомобилей, расстояние до работы и общее количество детей.
В начало
Профили атрибутов
На вкладке Профили атрибутов показано, как различные состояния входных атрибутов влияют на результат прогнозируемого атрибута.
Исследование модели на вкладке «Профили атрибутов»
Убедитесь, что в поле Прогнозируемый выбрано Покупатель велосипеда.
Если Обозначения интеллектуального анализа данных закрывает собой Профили атрибутов, переместите его в другое место.
В поле Столбцы гистограммы выберите значение 5.
В рассматриваемой модели значение 5 — это максимальное количество состояний для любой переменной.
Атрибуты, влияющие на состояние данного прогнозируемого атрибута, перечисляются вместе со значениями каждого состояния входных атрибутов и их распределениями по каждому состоянию прогнозируемого атрибута.
В столбце Атрибуты найдите пункт Число машин во владении. Обратите внимание на различия в гистограммах для покупателей велосипедов (столбец с меткой 1) и тех, кто не покупает (столбец с меткой 0). Человек, у которого есть один автомобиль или вообще нет машины, является наиболее вероятным покупателем велосипеда.
Дважды щелкните ячейку Число машин во владении в столбце покупателя велосипеда (столбец с меткой 1).
Обозначения интеллектуального анализа данных отображает более подробное представление.
В начало
Характеристики атрибута
На вкладке Характеристики атрибута можно выбрать атрибут и значение, чтобы узнать частоту появления значений других атрибутов во вхождениях выбранного значения.
Исследование модели на вкладке «Характеристики атрибута»
Убедитесь, что в списке Атрибут выбрано Покупатель велосипеда.
В поле Значение выберите 1.
В средстве просмотра будут показано, что заказчики, которые не имеют проживающих с ними детей, работают недалеко от дома и живут в Североамериканском регионе, являются более вероятными покупателями велосипеда.
В начало
Сравнение атрибутов
На вкладке Сравнение атрибутов можно изучать связь между двумя дискретными значениями покупателей велосипеда и другими значениями атрибутов. Поскольку в модели TM_NaiveBayes предусмотрено только два состояния, 1 и 0, не требуется вносить изменения в средство просмотра.
В средстве просмотра показано, что велосипеды, как правило, покупают люди, не имеющие в распоряжении машин, и наоборот, люди, имеющие две машины, большей частью велосипеды не покупают.
Следующее занятие
Занятие 5. Проверка моделей (учебник по интеллектуальному анализу данных — начальный уровень)
Предыдущая задача занятия
Изучение модели кластеризации (учебник по интеллектуальному анализу данных — начальный уровень)
См. также
Справочник
Вкладка «Сравнение атрибутов» (средство просмотра моделей интеллектуального анализа данных)
Вкладка «Профили атрибутов» (средство просмотра моделей интеллектуального анализа данных)
Вкладка «Характеристики атрибутов» (средство просмотра моделей интеллектуального анализа данных)
Вкладка «Сеть зависимостей» (средство просмотра моделей интеллектуального анализа данных)
Основные понятия
Просмотр модели с помощью средства просмотра упрощенного алгоритма Байеса (Майкрософт)