Создание новой структуры интеллектуального анализа данных
При создании решения интеллектуального анализа данных в службах MicrosoftSQL ServerAnalysis Services сначала необходимо создать структуру интеллектуального анализа данных в среде Business Intelligence Development Studio с помощью раздела Мастер интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных). Структура интеллектуального анализа данных определяет область данных, на основе которой строится модель интеллектуального анализа. Все модели интеллектуального анализа данных основаны на структуре.
Структуры интеллектуального анализа данных используют либо реляционные источники данных, либо источники данных OLAP. Реляционные структуры интеллектуального анализа данных основаны на данных, которые хранятся в системах реляционных баз данных, определенных в качестве представления источника данных. Структуры интеллектуального анализа OLAP основаны на измерении и связанных мерах куба OLAP, существующего в той же базе данных, что и структура.
Дополнительные сведения см. в разделах Проектирование баз данных, Проектирование объектов многомерных баз данных служб Analysis Services
Мастер интеллектуального анализа данных автоматически определяет структуру интеллектуального анализа данных и позволяет добавить в нее исходную модель интеллектуального анализа данных. Структура интеллектуального анализа данных может содержать несколько моделей анализа, поэтому для добавления моделей к структуре можно использовать компонент Конструктор интеллектуального анализа данных.
В следующих разделах приведены более подробные сведения о создании новых структур интеллектуального анализа данных с помощью мастера интеллектуального анализа данных, а также о настройке параметров в структуре интеллектуального анализа данных, позволяющих создавать проверочный набор или выполнять запросы к данным в структуре интеллектуального анализа.
Создание реляционной структуры интеллектуального анализа данных
Создание структуры интеллектуального анализа данных OLAP
Включение контрольных данных и детализации
Создание реляционной структуры интеллектуального анализа данных
Реляционные структуры интеллектуального анализа данных основаны на данных, доступных с помощью источника данных OLE DB. Если источник данных содержится в нескольких таблицах, то можно добавить его в мастер как отдельную таблицу вариантов с вложенными таблицами.
Дополнительные сведения см. в разделе Вложенные таблицы (службы Analysis Services — интеллектуальный анализ данных)
Мастер интеллектуального анализа данных помогает выполнить следующие шаги по созданию структуры для новой модели интеллектуального анализа данных.
Выбор типа источника данных. В данном случае реляционная база данных.
Принятие решения о том, что следует создавать: просто структуру или структуру с моделью интеллектуального анализа данных.
Выбор алгоритма для модели.
Выбор источника данных.
Выбор таблицы вариантов и (необязательно) вложенных таблиц.
Выбор типа для каждого столбца: прогнозируемый, входной или ключевой.
Указание типов содержимого столбца.
Указание необязательного набора контрольных данных.
Включение детализации в структуре, присвоение имени и сохранение новой структуры интеллектуального анализа данных и связанной с ней модели интеллектуального анализа данных.
Дополнительные сведения см. в разделахАлгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных), Столбцы модели интеллектуального анализа данных, Столбцы структуры интеллектуального анализа данных, Типы данных (интеллектуальный анализ данных), Типы содержимого (интеллектуальный анализ данных)
Создание структуры интеллектуального анализа данных OLAP
Кубы OLAP часто содержат настолько большое количество элементов и измерений, что иногда бывает трудно понять, откуда следует начинать интеллектуальный анализ данных. Чтобы определить закономерности в организации данных куба, обычно определяется одно интересующее измерение, и затем начинают исследоваться связанные с ним закономерности. В следующей таблице содержится список нескольких обычных задач интеллектуального анализа данных OLAP, описывающих образцы сценариев, в которых можно применять эти задачи, и определяющих алгоритм интеллектуального анализа данных, используемый в каждой задаче.
Задача |
Образец сценария |
Алгоритм |
---|---|---|
Группировка элементов в кластеры |
Разделение на сегменты измерения потребителей на основе свойств элементов потребителей, продукции, покупаемой потребителями, и суммы денег, которую тратят потребители. |
Алгоритм кластеризации (Майкрософт) |
Поиск требуемых или нестандартных элементов |
Определение требуемых или нестандартных запасов в измерении запасов на основе продаж, прибыли, местоположения и размера запасов. |
Алгоритм дерева принятия решений (Майкрософт) |
Поиск требуемых или нестандартных ячеек |
Определение продаж со склада, отличающихся от обычных трендов. |
Алгоритм временных рядов (Майкрософт) |
Мастер интеллектуального анализа данных помогает выполнить процедуру по созданию структуры для новой модели интеллектуального анализа данных.
Выбор типа источника данных. В данном случае куб.
Выбор алгоритма.
Выбор измерения исходного куба.
Выбор ключа варианта.
Выбор столбцов варианта.
Выбор вложенных таблиц.
Выбор использования для каждого столбца: прогнозируемый, входной или ключевой.
Задание типов содержимого столбца.
Разделение исходного куба.
Создание необязательного проверочного набора данных.
Присвоение имени и сохранение новой структуры интеллектуального анализа данных и связанной с ней модели интеллектуального анализа данных.
На последней странице мастера можно задать следующие параметры.
Разрешить детализацию
Создать измерение модели интеллектуального анализа данных
Создать куб с использованием измерения модели интеллектуального анализа данных
Если выбран параметр создания нового измерения модели интеллектуального анализа данных в исходном кубе, можно включить сведения, найденные алгоритмом интеллектуального анализа данных в источнике данных OLAP. Создание измерения модели интеллектуального анализа данных позволяет просматривать содержимое модели, а также выполнять запросы к нему в виде измерения. Этот режим доступен для моделей, построенных с помощью алгоритма кластеризации (Майкрософт), алгоритма дерева принятия решений (Майкрософт) и алгоритма взаимосвязей (Майкрософт).
Если выбрать параметр для создания нового куба, куб определяется по базе данных, включающей измерение модели интеллектуального анализа данных и, при необходимости, любые связанные измерения.
Дополнительные сведения см. в разделахАлгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных), Столбцы модели интеллектуального анализа данных, Столбцы структуры интеллектуального анализа данных, Типы данных (интеллектуальный анализ данных), Типы содержимого (интеллектуальный анализ данных)
Включение детализации и контрольных данных
При создании структуры интеллектуального анализа данных необходимо также задать два важных параметра для работы с данными: контрольные данные и детализация. Контрольные данные — это компонент SQL Server 2008, позволяющий секционировать данные в структуре интеллектуального анализа данных в обучающий набор и проверочный набор, чтобы использовать со всеми моделями, связанными с этой структурой. Дополнительные сведения см. в разделе Секционирование данных на обучающий и проверочный наборы данных (службы Analysis Services — интеллектуальный анализ данных).
Детализация позволяет просматривать данные источника в структуре интеллектуального анализа данных с помощью запросов к модели интеллектуального анализа данных. Это удобно при просмотре результатов модели интеллектуального анализа данных, когда нужно просмотреть дополнительные подробные сведения из базовых вариантов. Например, можно находить контактные сведения, варианты, которые использовались при обучении определенного кластера и т. д. Чтобы использовать детализацию, необходимо включить ее при создании структуры интеллектуального анализа данных. Позднее детализацию включить нельзя. Дополнительные сведения см. в разделе Использование детализации в моделях и структурах интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
См. также
Основные понятия
Управление моделями интеллектуального анализа данных в конструкторе интеллектуального анализа данных