Поделиться через


Проверка модели с фильтром (учебник по интеллектуальному анализу данных — начальный уровень)

Теперь, когда стало ясно, что наиболее точной является модель TM_Decision_Tree, ее следует оценить в контексте кампании прямой почтовой рассылки, проводимой фирмой Adventure Works Cycles. Отдел маркетинга компании хочет выяснить, существует ли разница в характеристиках мужчин и женщин, покупающих велосипеды. Эта информация поможет им в выборе журналов для размещения рекламы, а также в выборе продуктов, которые будут предложены в почтовых рассылках.

На этом занятии создается модель, в которой будет использоваться фильтр по полу. Затем можно будет легко скопировать данную модель или создать новую для другого пола, изменив лишь условия фильтра.

Дополнительные сведения о фильтрах см. в разделе Создание фильтров для моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Применение фильтров

Фильтры позволяют легко создавать модели на основе подмножеств данных. Фильтр используется только для модели и не изменяет базовый источник данных. Дополнительные сведения о применении фильтров к вложенным таблицам см. в разделе Учебник по интеллектуальному анализу данных — средний уровень (службы Analysis Services — интеллектуальный анализ данных).

Фильтры для таблиц вариантов

Вначале необходимо создать копию модели TM_Decision_Tree.

Создание копии модели дерева принятия решений

  1. В среде Business Intelligence Development Studio выберите ASDataMining2008 в обозревателе решений.

  2. Перейдите на вкладку Модели интеллектуального анализа данных.

  3. Щелкните правой кнопкой мыши модель TM_Decision_Tree и выберите пункт Новая модель интеллектуального анализа данных.

  4. В поле Имя модели введите TM_Decision_Tree_Male.

  5. Нажмите кнопку ОК.

После этого создайте фильтр для выбора клиентов для данной модели на основе пола.

Создание фильтра вариантов в модели интеллектуального анализа данных

  1. Щелкните правой кнопкой мыши модель интеллектуального анализа данных TM_Decision_Tree_Male, чтобы открыть контекстное меню.

    или

    Выберите модель. В меню Модель интеллектуального анализа данных выберите команду Установить фильтр моделей.

  2. В диалоговом окне Фильтр модели щелкните верхнюю строку сетки в текстовом поле Столбец структуры интеллектуального анализа данных.

    В раскрывающемся списке отображаются только имена столбцов таблицы.

  3. В текстовом поле «Столбец структуры интеллектуального анализа данных» выберите Пол.

    Значок слева от текстового поля изменится, указывая, что выбранным элементом является таблица или столбец.

  4. Щелкните текстовое поле Оператор и выберите оператор равенства (=) из списка.

  5. В текстовом поле Значение введите М.

  6. Щелкните следующую строку сетки.

  7. Нажмите кнопку ОК, чтобы закрыть окно «Фильтр модели».

    Фильтр отображается в окне Свойства. Также диалоговое окно Фильтр модели можно открыть из окна Свойства.

  8. Повторите вышеуказанные действия, но в качестве имени модели укажите TM_Decision_Tree_Female и введите Ж в текстовое поле Значение.

На вкладке Модели интеллектуального анализа данных появятся две новые модели.

Обработка моделей с фильтром

Модели можно использовать только после их развертывания и обработки. Дополнительные сведения об обработке моделей см. в разделе Обработка моделей в структуре интеллектуального анализа данных прямой почтовой рассылки (учебник по интеллектуальному анализу данных — начальный уровень).

Выполнение обработки модели с фильтром

  1. Щелкните правой кнопкой мыши модель TM_Decision_Tree_Male и выберите пункт Обработать структуру интеллектуального анализа данных и все модели.

  2. Нажмите кнопку Выполнить, чтобы выполнить обработку новых моделей.

  3. После успешного завершения обработки нажмите кнопку Закрыть в обоих окнах обработки.

Анализ результатов

Изучите результаты и оцените точность моделей с фильтрами тем же способом, который применялся для предыдущих трех моделей. Дополнительные сведения см. в следующих разделах.

Изучение модели дерева принятия решений (учебник по интеллектуальному анализу данных — начальный уровень)

Проверка точности при помощи диаграмм точности прогнозов (учебник интеллектуального анализа данных, начальный уровень)

Исследование моделей с фильтрами

  1. Перейдите на вкладку Средство просмотра моделей интеллектуального анализа данных в Конструкторе интеллектуального анализа данных.

  2. В поле «Модель интеллектуального анализа данных» выберите значение TM_Decision_Tree_Male.

  3. Переместите ползунок Отображение уровня на значение 3.

  4. Задайте параметру Фон значение 1.

  5. Поместите курсор на узел с названием Все, чтобы просмотреть количество покупателей велосипедов по сравнению с покупателями другой продукции.

  6. Повторите шаги 1–5 для модели TM_Decision_Tree_Female.

  7. Изучите результаты для модели TM_Decision_Tree и моделей с фильтром по полу. По сравнению со всеми покупателями велосипедов мужчины и женщины, покупающие велосипеды, имеют некоторые общие характеристики с общей массой покупателей велосипедов, но между всеми тремя группами покупателей есть и интересные различия. Это полезная информация, которую фирма Adventure Works Cycles может использовать для проведения маркетинговой кампании.

Проверка точности моделей с фильтрами

  1. На вкладке Диаграмма точности интеллектуального анализа конструктора интеллектуального анализа данных в среде Business Intelligence Development Studio перейдите на вкладку Выбор входа.

  2. В группе Выбор набора данных для диаграммы точности выберите значение Использовать проверочные варианты структуры интеллектуального анализа данных.

  3. На вкладке Выбор входа конструктора интеллектуального анализа данных в группе Выбрать прогнозируемые столбцы модели интеллектуального анализа данных для отображения на диаграмме точности прогнозов установите флажок Синхронизировать столбцы и значения прогноза.

  4. Убедитесь, что в столбце Имя прогнозируемого столбца для каждой модели выбран пункт Покупатель велосипеда.

  5. В столбце Показать выберите каждую из моделей.

  6. В столбце Прогнозируемое значение выберите 1.

  7. Щелкните вкладку Диаграмма точности прогнозов для просмотра диаграммы.

    Обратите внимание, что все модели на основе дерева принятия решений демонстрируют заметную точность по сравнению с моделью случайного выбора, а также превосходят по точности модели на основе алгоритма кластеризации и упрощенного алгоритма Байеса.