Проверка модели с фильтром (учебник по интеллектуальному анализу данных — начальный уровень)
Теперь, когда стало ясно, что наиболее точной является модель TM_Decision_Tree, ее следует оценить в контексте кампании прямой почтовой рассылки, проводимой фирмой Компания Adventure Works Cycles. Отделу маркетинга компании Компания Adventure Works Cycles требуется выяснить, существует ли разница в характеристиках мужчин и женщин, покупающих велосипеды. Эта информация поможет им в выборе журналов для размещения рекламы, а также в выборе продуктов, которые будут предложены в почтовых рассылках.
На этом занятии создается модель, в которой будет использоваться фильтр по полу. Затем можно будет легко скопировать данную модель или создать новую для другого пола, изменив лишь условия фильтра.
Дополнительные сведения о фильтрах см. в разделе Фильтры для моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
Применение фильтров
Фильтры позволяют легко создавать модели на основе подмножеств данных. Фильтр используется только для модели и не изменяет базовый источник данных. Дополнительные сведения о применении фильтров к вложенным таблицам см. в разделе Учебник по интеллектуальному анализу данных — средний уровень (службы Analysis Services — интеллектуальный анализ данных).
Фильтры для таблиц вариантов
Вначале необходимо создать копию модели TM_Decision_Tree.
Создание копии модели дерева принятия решений
В среде SQL Server Data Tools (SSDT) в обозревателе решений выберите BasicDataMining.
Перейдите на вкладку Модели интеллектуального анализа данных.
Щелкните правой кнопкой мыши модель TM_Decision_Tree и выберите пункт Новая модель интеллектуального анализа данных.
В поле Имя модели введите TM_Decision_Tree_Male.
Нажмите кнопку ОК.
После этого создайте фильтр для выбора клиентов для данной модели на основе пола.
Создание фильтра вариантов в модели интеллектуального анализа данных
Щелкните правой кнопкой мыши модель интеллектуального анализа данных TM_Decision_Tree_Male, чтобы открыть контекстное меню.
или
Выберите модель. В меню Модель интеллектуального анализа данных выберите команду Установить фильтр моделей.
В диалоговом окне Фильтр модели щелкните верхнюю строку сетки в текстовом поле Столбец структуры интеллектуального анализа данных.
В раскрывающемся списке отображаются только имена столбцов таблицы.
В текстовом поле «Столбец структуры интеллектуального анализа данных» выберите Пол.
Значок слева от текстового поля изменится, указывая, что выбранным элементом является таблица или столбец.
Щелкните текстовое поле Оператор и выберите оператор равенства (=) из списка.
Щелкните текстовое поле Значение и введите М.
Щелкните следующую строку сетки.
Нажмите кнопку ОК, чтобы закрыть диалоговое окно Фильтр модели.
Фильтр отобразится в окне Свойства. Диалоговое окно Фильтр модели можно также открыть из окна Свойства.
Повторите вышеуказанные действия, но в качестве имени модели укажите TM_Decision_Tree_Female и введите Ж в текстовое поле Значение.
На вкладке Модели интеллектуального анализа данных появятся две новые модели.
Обработка моделей с фильтром
Модели можно использовать только после их развертывания и обработки. Дополнительные сведения об обработке моделей см. в разделе Обработка моделей в структуре интеллектуального анализа данных прямой почтовой рассылки (учебник по интеллектуальному анализу данных — начальный уровень).
Выполнение обработки модели с фильтром
Щелкните правой кнопкой мыши модель TM_Decision_Tree_Male и выберите пункт Обработать структуру интеллектуального анализа данных и все модели.
Нажмите кнопку Выполнить, чтобы выполнить обработку новых моделей.
После успешного завершения обработки нажмите кнопку Закрыть в обоих окнах обработки.
Анализ результатов
Изучите результаты и оцените точность моделей с фильтрами тем же способом, который применялся для предыдущих трех моделей. Дополнительные сведения см. в следующих разделах.
Исследование моделей с фильтрами
Перейдите на вкладку Средство просмотра моделей интеллектуального анализа данных в Конструкторе интеллектуального анализа данных.
В поле «Модель интеллектуального анализа данных» выберите значение TM_Decision_Tree_Male.
Переместите ползунок Отображение уровня на значение 3.
Задайте параметру Фон значение 1.
Поместите курсор на узел с названием Все, чтобы просмотреть количество покупателей велосипедов по сравнению с покупателями другой продукции.
Повторите шаги 1–5 для модели TM_Decision_Tree_Female.
Изучите результаты для модели TM_Decision_Tree и моделей с фильтром по полу. По сравнению со всеми покупателями велосипедов мужчины и женщины, покупающие велосипеды, имеют некоторые общие характеристики с общей массой покупателей велосипедов, но между всеми тремя группами покупателей есть и интересные различия. Это полезная информация, которую фирма Компания Adventure Works Cycles может использовать для проведения маркетинговой кампании.
Проверка точности моделей с фильтрами
На вкладке Диаграмма точности интеллектуального анализа конструктора интеллектуального анализа данных в среде SQL Server Data Tools (SSDT) перейдите на вкладку Выбор входа.
В группе Выбор набора данных для диаграммы точности выберите значение Использовать проверочные варианты структуры интеллектуального анализа данных.
На вкладке Выбор входа конструктора интеллектуального анализа данных в группе Выбрать прогнозируемые столбцы модели интеллектуального анализа данных для отображения на диаграмме точности прогнозов установите флажок Синхронизировать столбцы и значения прогноза.
Убедитесь, что в столбце Имя прогнозируемого столбца для каждой модели выбран пункт Покупатель велосипеда.
В столбце Показать выберите каждую из моделей.
В столбце Прогнозируемое значение выберите 1.
Щелкните вкладку Диаграмма точности прогнозов для просмотра диаграммы.
Обратите внимание, что все три модели дерева принятия решений демонстрируют заметную точность по сравнению с моделью случайного выбора, а также превосходят по точности модели на основе алгоритма кластеризации и упрощенного алгоритма Байеса.
Предыдущая задача занятия
Следующее занятие
См. также
Задания
удалить фильтр из модели интеллектуального анализа данных
Основные понятия
Другие ресурсы
Задачи и инструкции по модели интеллектуального анализа данных