Поделиться через


Создание структуры модели интеллектуального анализа данных прямой почтовой рассылки (учебник по интеллектуальному анализу данных — начальный уровень)

Первым шагом в создании сценария целевой рассылки является использование мастера интеллектуального анализа данных в SQL Server Data Tools (SSDT) для создания новой структуры интеллектуального анализа данных и модели дерева принятия решений.

В этой задаче вы настроите новую структуру интеллектуального анализа данных и добавите начальную модель интеллектуального анализа данных на основе алгоритма Деревьев принятия решений (Майкрософт). Для создания такой структуры сначала необходимо выбрать таблицы и представления, а затем указать столбцы для обучения и столбцы для проверки.

Создание структуры интеллектуального анализа данных для сценария прямой почтовой рассылки

  1. В Обозреватель решений щелкните правой кнопкой мыши Структуры интеллектуального анализа данных и выберите Создать структуру интеллектуального анализа данных, чтобы запустить мастер интеллектуального анализа данных.

  2. На странице Вас приветствует мастер интеллектуального анализа данных нажмите кнопку Далее.

  3. На странице Выбор метода определения убедитесь, что выбран параметр Из существующей реляционной базы данных или хранилища данных , а затем нажмите кнопку Далее.

  4. На странице Создание структуры интеллектуального анализа данных в разделе Какой метод интеллектуального анализа данных вы хотите использовать? выберите Деревья принятия решений Майкрософт.

    Примечание

    Если появится предупреждение о том, что алгоритмов интеллектуального анализа данных не обнаружено, это может означать, что свойства проекта настроены неправильно. Это предупреждение возникает, когда проект пытается получить список алгоритмов интеллектуального анализа данных с сервера служб Analysis Services и не может найти сервер. По умолчанию SQL Server Data Tools будет использовать localhost в качестве сервера. Если используется другой экземпляр или именованный экземпляр, нужно изменить свойства проекта. Дополнительные сведения см. в статье Создание проекта служб Analysis Services (учебник по базовому интеллектуальному анализу данных).

  5. Щелкните Далее.

  6. На странице Выбор представления источника данных в области Доступные представления источников данных выберите Целевая рассылка. Вы можете нажать кнопку Обзор , чтобы просмотреть таблицы в представлении источника данных, а затем нажать кнопку Закрыть , чтобы вернуться к мастеру.

  7. Щелкните Далее.

  8. На странице Указание типов таблиц выберите поле проверка в столбце Вариант для vTargetMail, чтобы использовать его в качестве таблицы вариантов, а затем нажмите кнопку Далее. Таблица ProspectiveBuyer будет использоваться позже в целях проверки, поэтому на данном этапе ее не нужно учитывать.

  9. На странице Указание обучающих данных вы определите по крайней мере один прогнозируемый столбец, один ключевой столбец и один входной столбец для модели. Выберите поле проверка в столбце Прогнозируемо в строке BikeBuyer.

    Примечание

    Обратите внимание на предупреждение в нижней части окна. Вы не сможете перейти к следующей странице, пока не выберете хотя бы один столбец входных данных и один прогнозируемый столбец.

  10. Нажмите кнопку Предложить , чтобы открыть диалоговое окно Предложить связанные столбцы .

    Кнопка Предложить включается каждый раз, когда выбран хотя бы один прогнозируемый атрибут. В диалоговом окне Предложить связанные столбцы перечислены столбцы, которые наиболее тесно связаны с прогнозируемым столбцом, и упорядочивает атрибуты по их корреляции с прогнозируемым атрибутом. Столбцы со значительной корреляцией (степень достоверности превышает 95 %) автоматически выделены как включаемые в модель.

    Просмотрите предложения, а затем нажмите кнопку Отмена или нажмите кнопку Предложения.

    Примечание

    Если нажать кнопку ОК, все перечисленные предложения будут помечены мастером как входные столбцы. Если нужны не все предложения, значения придется изменять вручную.

  11. Убедитесь, что в строке CustomerKey выбрано поле проверка в столбце Ключ.

    Примечание

    Если для таблицы с входными данными из представления источников данных указан ключ, мастер интеллектуального анализа данных автоматически выберет этот столбец в качестве ключа для модели.

  12. Выберите поля проверка в столбце Входные данные в следующих строках. Чтобы установить флажки в нескольких столбцах, можно выделить диапазон ячеек и удерживать нажатой клавишу CTRL при установке флажка.

    • Age

    • CommuteDistance

    • EnglishEducation

    • EnglishOccupation

    • Gender

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • NumberChildrenAtHome

    • Регион

    • TotalChildren

    • YearlyIncome

  13. В крайнем левом столбце на странице установите флажки в перечисленных ниже строках.

    • AddressLine1

    • AddressLine2

    • DateFirstPurchase

    • EmailAddress

    • FirstName

    • LastName

    Убедитесь, что эти строки имеют флажки только в левом столбце. Эти столбцы будут добавлены в структуру, но не будут включены в модель. Однако после построения модели их можно будет использовать для детализации и проверки. Дополнительные сведения о детализации см. в разделе Запросы детализации (интеллектуальный анализ данных).

  14. Щелкните Далее.

Следующая задача занятия

Указание типа данных и типа содержимого (учебник по интеллектуальному анализу данных — начальный уровень)

См. также:

Определение типов таблиц (мастер интеллектуального анализа данных)
Конструктора моделей интеллектуального анализа данных
Алгоритм дерева принятия решений (Майкрософт)