Поделиться через


Создание прогнозов (учебник по интеллектуальному анализу данных — начальный уровень)

Когда точность моделей интеллектуального анализа данных проверена и модели признаны пригодными, можно создавать прогнозирующие запросы, используя для этого построитель прогнозирующих запросов на вкладке Прогноз модели интеллектуального анализа данных в конструкторе интеллектуального анализа данных. Этот интерфейс помогает строить запросы в расширении интеллектуального анализа данных или на языке расширений интеллектуального анализа данных (DMX). Синтаксис расширения интеллектуального анализа данных похож на синтаксис T-SQL, но служит для написания запросов к объектам интеллектуального анализа данных.

Построитель прогнозирующих запросов имеет три представления. В представлениях Конструирование и Запрос можно создать и проверить запрос. Затем этот запрос можно выполнить и просмотреть результаты в представлении Результат.

Дополнительные сведения об использовании построителя прогнозирующих запросов см. в разделе Интерфейсы запросов интеллектуального анализа данных.

Создание запроса

Первым шагом в создании прогнозирующего запроса является выбор модели интеллектуального анализа данных и входной таблицы.

Выбор модели и входной таблицы

  1. На вкладке Прогноз модели интеллектуального анализа данных конструктора интеллектуального анализа данных в поле Модель интеллектуального анализа нажмите кнопку Выбрать модель.

  2. В диалоговом окне Выбор модели интеллектуального анализа данных перейдите по дереву к структуре Targeted Mailing, разверните узел этой структуры, выберите TM_Decision_Tree, а затем нажмите кнопку ОК.

  3. В поле Выбор входных таблиц нажмите кнопку Выбрать таблицу вариантов.

  4. В диалоговом окне Выбор таблицы в списке Источник данных выберите Adventure Works DW Multidimensional 2012 .

  5. В поле Имя таблицы/представления выберите таблицу ProspectiveBuyer (dbo) и нажмите кнопку ОК.

    Таблица ProspectiveBuyer наиболее похожа на таблицу вариантов vTargetMail.

Сопоставление столбцов

После выбора входной таблицы в построителе прогнозируемых запросов будет создано сопоставление по умолчанию между моделью интеллектуального анализа данных и таблицей входных данных на основе имен столбцов. По крайней мере один столбец структуры необходимо сопоставить со столбцом внешних данных.

Важное примечаниеВажно!

Данные, которые используются для определения точности моделей, должны содержать столбец, который может быть сопоставлен с прогнозируемым столбцом. Если такой столбец не существует, то можно создать его с пустыми значениями, однако этот столбец должен иметь тот же тип данных, что и прогнозируемый.

Сопоставление столбцов структуры со столбцами входной таблицы

  1. Щелкните правой кнопкой мыши линии, соединяющие между собой окна Модель интеллектуального анализа данных и Выбор входной таблицы, и выберите команду Изменить соединения.

    Обратите внимание, что сопоставляется не каждый столбец. Добавим сопоставления для нескольких столбцов таблицы. Кроме того, сформируем новый столбец с датой рождения, исходя из текущего столбца данных так, чтобы столбцы лучше совпадали.

  2. В разделе Столбец таблицы щелкните ячейку Bike Buyer и в раскрывающемся списке выберите ProspectiveBuyer.Unknown.

    При этом прогнозируемый столбец [Bike Buyer] сопоставляется со столбцом входной таблицы.

  3. Нажмите кнопку ОК.

  4. В окне Обозреватель решений щелкните правой кнопкой мыши представление источника данных Целевая рассылка и выберите пункт Конструктор представлений.

  5. Щелкните правой кнопкой мыши таблицу ProspectiveBuyer и выберите команду Создать именованное вычисление.

  6. В диалоговом окне Создание именованного вычисления в поле Имя столбца введите calcAge.

  7. В поле Описание введите «Расчет возраста, исходя из даты рождения».

  8. В поле Выражение введите DATEDIFF(YYYY,[BirthDate],getdate()) и нажмите кнопку ОК.

    Поскольку во входной таблице нет столбца Возраст, соответствующего столбцу в режиме, можно использовать это выражение для расчета возраста пользователя из столбца BirthDate во входной таблице. Поскольку столбец Возраст был определен как наиболее важный для прогнозирования покупательского спроса на велосипеды, он должен присутствовать и в модели, и во входной таблице.

  9. В конструкторе интеллектуального анализа данных выберите вкладку Прогноз модели интеллектуального анализа данных и снова откройте окно Изменение соединений.

  10. В разделе Столбец таблицы щелкните ячейку Возраст и выберите в раскрывающемся списке ProspectiveBuyer.calcAge.

    ПредупреждениеВнимание!

    Если столбец не появился в списке, то может потребоваться обновить определение представления источников данных, загруженного в конструктор. Для этого в меню Файл выберите команду Сохранить все, а затем закройте и снова откройте проект в конструкторе.

  11. Нажмите кнопку ОК.

Проектирование прогнозирующего запроса

Создание прогнозирующего запроса

  1. Первой кнопкой на панели инструментов вкладки Прогноз модели интеллектуального анализа данных является кнопка Переключиться в представление проектирования / Переключиться в представление результатов / Переключиться в представление запроса. Щелкните стрелку вниз на этой кнопке и выберите Проект.

  2. В сетке на вкладке Прогноз модели интеллектуального анализа данных щелкните ячейку в первой пустой строке столбца Источник и выберите значение Прогнозирующая функция.

  3. В ячейке, расположенной на пересечении строки Прогнозирующая функция и столбца Поле, выберите значение PredictProbability.

    В столбце Псевдоним той же строки введите «Вероятность результата».

  4. В расположенном выше окне Модель интеллектуального анализа данных выделите элемент [Bike Buyer] и перетащите его в ячейку Критерий/аргумент.

    После этого в ячейке Критерий/аргумент появится элемент [TM_Decision_Tree].[Bike Buyer] .

    Таким образом определяется целевой столбец для функции PredictProbability. Дополнительные сведения о функциях см. в разделе Справочник по функциям расширений интеллектуального анализа данных.

  5. Щелкните следующую пустую строку в столбце Источник и выберите TM_Decision_Tree mining model**.**

  6. В ячейке, расположенной на пересечении строки TM_Decision_Tree и столбца Поле, выберите значение Bike Buyer.

  7. В строке TM_Decision_Tree столбца Критерий или аргумент введите значение =1.

  8. Щелкните следующую пустую строку в столбце Источник и выберите значение Таблица ProspectiveBuyer.

  9. В строке ProspectiveBuyer столбца Поле выберите значение ProspectiveBuyerKey.

    При этом к прогнозирующему запросу добавляется уникальный идентификатор, который позволяет определить возможных покупателей велосипедов.

  10. Добавьте еще пять строк в сетку. Для каждой строки в столбце Источник выберите значение Таблица ProspectiveBuyer, а затем добавьте в ячейки Поле следующие столбцы:

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

Наконец, выполните запрос и просмотрите результаты.

Выполнение запроса и просмотр результатов

  1. На вкладке Прогноз модели интеллектуального анализа данных нажмите кнопку Результат.

  2. После выполнения запроса отображаются результаты для просмотра.

    На вкладке Прогноз модели интеллектуального анализа данных отображаются контактные данные вероятных покупателей велосипедов. В столбце Вероятность результата указывается вероятность получения точного прогноза. Эти результаты можно использовать, чтобы определить, для каких потенциальных заказчиков следует выполнить прямую почтовую рассылку.

  3. На этом этапе можно сохранить результаты. Имеются три параметра.

    • Щелкните правой кнопкой мыши строку данных в результатах и выберите Копировать, чтобы сохранить только это значение (и заголовок столбца) в буфер обмена.

    • Щелкните правой кнопкой мыши любую строку в результатах и выберите Копировать все, чтобы скопировать весь результирующий набор, включая заголовки, в буфер обмена.

    • Щелкните Сохранить результат запроса для сохранения результатов непосредственно в базе данных следующим образом:

      1. В диалоговом окне Сохранение результата запроса интеллектуального анализа данных выберите источник данных или определите новый источник данных.

      2. Введите имя таблицы, которая будет хранить результаты запроса.

      3. Используйте параметр Добавить к представлению источника данных, чтобы создать таблицу и добавить ее в существующее представлении источников данных. Это удобно, если нужно хранить в модели в одном и том же представлении источников данных все связанные таблицы, такие как обучающие данные, исходные данные для прогнозирования и результаты запроса.

      4. Используйте параметр Переписать, если существует, чтобы обновить существующую таблицу с использованием последних результатов.

        Необходимо использовать параметр перезаписи таблицы при добавлении любых столбцов к прогнозирующему запросу, изменении имен или типов данных любых столбцов в прогнозирующем запросе или при выполнении любых инструкций ALTER для целевой таблицы.

        Кроме того, если несколько столбцов имеют одинаковые имена (например, применяемое по умолчанию имя столбца Выражение), то необходимо создать псевдоним для столбцов с повторяющимися именами, поскольку возникает ошибка, когда конструктор пытается сохранить результаты в SQL Server. Причина в том, что SQL Server не разрешает применять несколько столбцов с одинаковыми именами.

        Дополнительные сведения см. в разделе Диалоговое окно «Сохранение результатов запроса интеллектуального анализа данных» (представление прогноза модели интеллектуального анализа данных).

Следующая задача в занятии

Использование детализации для данных структуры (учебник по интеллектуальному анализу данных — начальный уровень)

См. также

Задания

Создание прогнозирующего запроса с помощью построителя прогнозирующих запросов

Другие ресурсы

Использование построителя прогнозирующих запросов для создания прогнозирующих запросов расширений интеллектуального анализа данных