Добавление представления источника данных с вложенными таблицами (учебник по интеллектуальному анализу данных — средний уровень)
Чтобы создать модель интеллектуального анализа для анализа покупательского поведения, необходимо создать представление источника данных. Это представление также будет использоваться в сценарии кластеризации последовательностей.
Данное представление источника данных отличается от других тем, что в нем содержится вложенная таблица. Вложенная таблица — это таблица, содержащая несколько строк сведений об одной строке в таблице вариантов. Например, если модель анализирует поведение клиентов в процессе покупки, обычно в качестве таблицы вариантов используется таблица, содержащая уникальную строку для каждого клиента. Однако каждый клиент может выполнить несколько покупок, и может понадобиться проанализировать последовательность покупок или продукты, часто приобретаемые совместно. Для логического представления данных покупок в модели необходимо добавить в представление источника данных еще одну таблицу, в которой будут перечисляться покупки каждого клиента.
Вложенная таблица покупок связана с таблицей клиентов связью «многие к одному». Вложенная таблица может содержать множество строк для каждого клиента, а каждая строка содержит один купленный продукт, иногда с дополнительными сведениями о заказах, на основании которых были сделаны покупки, о цене на момент заказа или любых действовавших акциях. Сведения вложенной таблицы можно использовать в качестве входных данных для модели или прогнозируемого атрибута.
На этом занятии будут выполнены следующие действия.
Будет добавлено представление источника данных к источнику данных Adventure Works DW2008R2.
В данное представление будут добавлены таблица вариантов и вложенные таблицы.
Будет задана связь «многие к одному» между таблицей вариантов и вложенной таблицей.
Примечание . Очень важно точно следовать описанной процедуре и правильно задать связь между таблицей вариантов и вложенной таблицей, иначе при попытке обработки модели могут появиться ошибки.
Затем задается способ использования столбцов данных в модели.
Дополнительные сведения о работе с таблицами вариантов и вложенными таблицами, а также о выборе ключа вложенной таблицы см. в разделе Вложенные таблицы (службы Analysis Services — интеллектуальный анализ данных).
Добавление представления источника данных
В обозревателе решений щелкните правой кнопкой мыши элемент Представления источников данных и выберите команду Создать представление источника данных.
Будет открыт мастер представлений источников данных.
На странице Мастер представлений источников данных щелкните Далее.
На странице Выбор источника данных в меню Реляционные источники данных выберите источник данных Adventure Works DW2008R2, созданный в учебнике по интеллектуальному анализу данных (начальный уровень). Нажмите кнопку Далее.
На странице Выбор таблиц и представлений выберите следующие таблицы, а затем щелкните стрелку вправо, чтобы включить их в новое представление источника данных.
vAssocSeqOrders
vAssocSeqLineItems
Нажмите кнопку Далее.
На странице Завершение работы мастера представлению источника данных по умолчанию присваивается имя Adventure Works DW2008R2. Измените это имя на Заказы и нажмите кнопку Готово.
Откроется конструктор представлений источников данных, где будет отображено представление источника данных Заказы.
Создание связи между таблицами
В конструкторе представлений источников данных расположите две таблицы горизонтально друг напротив друга, поместив таблицу vAssocSeqLineItems слева, а vAssocSeqOrders — справа.
Выделите столбец OrderNumber в таблице vAssocSeqLineItems.
Перетащите этот столбец на столбец OrderNumber таблицы vAssocSeqOrders.
Важно! Обязательно перетащите столбец OrderNumber из вложенной таблицы vAssocSeqLineItems,которая представляет сторону соединения «многие», в таблицу вариантов vAssocSeqOrders,которая представляет сторону соединения «один».
Между таблицами vAssocSeqLineItems и vAssocSeqOrders создана новая связь многие к одному. Если соединение таблиц выполнено правильно, должно появиться следующее представление источника данных:
Следующая задача занятия
См. также