Поделиться через


Создание структуры модели интеллектуального анализа данных кластеризации последовательностей (учебник по интеллектуальному анализу данных — средний уровень)

 

Применимо к: SQL Server 2016 Preview

Первым шагом в создании последовательности кластерной модели интеллектуального анализа данных является использование мастера интеллектуального анализа данных для создания новой структуры интеллектуального анализа данных и модели интеллектуального анализа данных на основе Microsoft алгоритм кластеризации последовательностей.

Будет использоваться же представление источника данных, который используется для анализа потребительской корзины, но будет добавлен столбец, содержащий последовательность идентификатор. В данном сценарии «sequence» означает порядок, в котором покупатели добавляют элементы в свою корзину во время покупок.

Также будут добавлены несколько столбцов, которые используются в одной из моделей для группировки покупателей по демографическому признаку.

Создание структуры кластеризации последовательностей и модели

  1. В обозревателе решений в SQL Server Data Tools (SSDT), щелкните правой кнопкой мыши структуры интеллектуального анализа данных и выберите новую структуру интеллектуального анализа данных.

  2. На странице Вас приветствует мастер интеллектуального анализа данных нажмите кнопку Далее.

  3. На Выбор метода определения Убедитесь, что из существующей реляционной базы данных или хранилища данных выбран и нажмите кнопку Далее.

  4. На создать структуру интеллектуального анализа данных Убедитесь, что параметр создать структуру интеллектуального анализа данных с моделью интеллектуального анализа данных выбран. Затем нажмите кнопку раскрывающегося списка для параметра какой метод интеллектуального анализа данных требуется использовать?, и выберите кластеризации последовательностей Майкрософт. Нажмите кнопку Далее.

    Выбор представления источника данных появится страница. В разделе Доступные представления источника данных, выберите заказов.

    Заказы — это то представление источника данных, которое использовалось для сценария потребительской корзины. Если вы не создали это представление источника данных, см. раздел Добавление представления источников данных с вложенными таблицами ( Intermediate Data Mining Tutorial ).

  5. Нажмите кнопку Далее.

  6. На Определение типов таблиц выберите случае флажок рядом с vAssocSeqOrders и выберите Nested флажок рядом с vAssocSeqLineItems таблицы. Нажмите кнопку Далее.

    Примечание


    Если ошибка возникает при выборе случай или Nested флажки, возможно, что соединение в представлении источника данных не является правильным. Вложенная таблица vAssocSeqLineItems, должен быть подключен к таблице вариантов vAssocSeqOrders, с помощью соединения многие к одному. Можно изменить эту связь, щелкнув правой кнопкой мыши на линии соединения и затем изменив направление соединения на обратное. Дополнительные сведения см. в разделе Создать или изменить связь диалоговое окно ( Analysis Services — многомерные данные ).

  7. На Определение обучающих данных Выберите столбцы для использования в модели, установив флажок следующим образом:

    • IncomeGroupвыберите ввода флажок.

      Данный столбец содержит полезную информацию о покупателях, которую можно использовать для кластеризации. Такая информация будет использоваться в первой модели и не будет учитываться во второй.

    • OrderNumberвыберите ключ флажок.

      В этом поле будет использоваться как идентификатор для таблицы вариантов или ключ. В целом ключевое поле таблицы вариантов никогда не используется в качестве входных данных, поскольку ключ содержит уникальные значения, не представляющие интереса для кластеризации.

    • Областьвыберите ввода флажок.

      Данный столбец содержит полезную информацию о покупателях, которую можно использовать для кластеризации. Такая информация будет использоваться в первой модели и не будет учитываться во второй.

    • LineNumberвыберите ключ и ввода флажки.

      LineNumber поле будет использоваться в качестве идентификатора для вложенной таблицы или последовательность ключа. Ключ для вложенной таблицы всегда должен использоваться для ввода.

    • Модельвыберите ввода и прогнозируемый флажки.

    Убедитесь, что выбранные параметры указаны правильно и нажмите кнопку Далее.

  8. На содержимого и типа данных столбцов указать убедитесь, что Сетка содержит столбцы, типы содержимого и типы данных, приведенные в следующей таблице и нажмите кнопку Далее.

    Таблицы и столбцы Тип содержимого Тип данных
    IncomeGroup Discrete Текст
    OrderNumber Key Текст
    Регион Discrete Текст
    vAssocSeqLineItems
    Line Number Ключевая последовательность Long
    Модель Discrete Текст
  9. На Создание проверочного набора измените Процент проверочных данных 20, а затем нажмите кнопку Далее.

  10. На Завершение работы мастера страницы, для имя структуры интеллектуального анализа данных, тип Кластеризация последовательностей по регионам.

  11. Для имя модели интеллектуального анализа данных, тип Кластеризация последовательностей по регионам.

  12. Проверьте Разрешить детализацию а затем щелкните Готово.

Следующая задача занятия

Обработка модели кластеризации последовательностей

См. также:

конструктор интеллектуального анализа данных
Алгоритм кластеризации последовательностей (Майкрософт)