Создание новой структуры интеллектуального анализа данных
При создании решения интеллектуального анализа данных в службах Microsoft SQL Server Службы Analysis Services сначала необходимо создать структуру интеллектуального анализа данных в среде Business Intelligence Development Studio с помощью раздела Мастер интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных). Структура интеллектуального анализа данных определяет область определения данных, на основе которой строится модель интеллектуального анализа. Все модели интеллектуального анализа данных основаны на структуре.
Структуры интеллектуального анализа данных используют либо реляционные источники данных, либо источники данных аналитической обработки в сети (online analytical processing — OLAP). Реляционные структуры интеллектуального анализа данных основаны на данных, которые хранятся в таблицах, файлах или системах реляционных баз данных, определенных в качестве представления источника данных. Структуры интеллектуального анализа OLAP основаны на измерении связанных мерах куба OLAP, существующего в той же базе данных, что и структура.
Дополнительные сведения см. в разделахПроектирование баз данных, Проектирование объектов многомерных баз данных служб Analysis Services
Мастер интеллектуального анализа данных автоматически определяет структуру интеллектуального анализа данных и позволяет добавить в нее исходную модель интеллектуального анализа данных. Структура интеллектуального анализа данных может содержать несколько моделей анализа, поэтому для добавления моделей к структуре можно использовать компонент Конструктор интеллектуального анализа данных.
В следующих разделах приведены более подробные сведения о создании новых структур интеллектуального анализа данных с помощью мастера интеллектуального анализа данных, а также о настройке параметров в структуре интеллектуального анализа данных, позволяющих создавать проверочный набор или выполнять запросы к данным в структуре интеллектуального анализа.
Создание реляционной структуры интеллектуального анализа данных
Создание структуры интеллектуального анализа данных OLAP
Включение контрольных данных и детализации
Создание реляционной структуры интеллектуального анализа данных
Реляционные структуры интеллектуального анализа данных основаны на данных, доступных с помощью источника данных OLE DB. Если данные источника содержатся в нескольких таблицах, можно создать представление источника данных, объединяющее все необходимые таблицы и столбцы. Если таблицы включают какое-либо отношение «один-ко-многим» — например, сведения о нескольких покупках каждого клиента, — можно добавить обе таблицы и использовать одну таблицу как таблицу вариантов и данные из стороны «многие» этой связи как вложенные таблицы.
Дополнительные сведения см. в разделеВложенные таблицы (службы Analysis Services — интеллектуальный анализ данных)
Мастер интеллектуального анализа данных помогает выполнить следующие шаги по созданию структуры для новой модели интеллектуального анализа данных.
Выбор типа источника данных. В данном случае — реляционная база данных.
Принятие решения о том, что следует создавать: просто структуру или структуру с моделью интеллектуального анализа данных.
Выбор алгоритма для модели.
Выбор источника данных.
Выбор таблицы вариантов и, необязательно, вложенных таблиц.
Выбор типа для каждого столбца: прогнозируемый, входной или ключевой.
Указание типов содержимого столбца.
Указание необязательного набора контрольных данных.
Включение детализации в структуре, присвоение имени и сохранение новой структуры интеллектуального анализа данных и связанной с ней модели интеллектуального анализа данных.
Дополнительные сведения см. в разделахАлгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных), Столбцы модели интеллектуального анализа данных, Столбцы структуры интеллектуального анализа данных, Типы данных (интеллектуальный анализ данных), Типы содержимого (интеллектуальный анализ данных)
Создание структуры интеллектуального анализа данных OLAP
Кубы OLAP часто содержат настолько большое количество элементов и измерений, что иногда бывает трудно понять, откуда следует начинать интеллектуальный анализ данных. Чтобы определить закономерности в организации данных куба, обычно определяется одно интересующее измерение, и затем начинают исследоваться связанные с ним закономерности. В следующей таблице содержится список нескольких обычных задач интеллектуального анализа данных OLAP, описывающих образцы сценариев, в которых можно применять эти задачи, и определяющих алгоритм интеллектуального анализа данных, используемый в каждой задаче.
Задача |
Образец сценария |
Алгоритм |
---|---|---|
Группировка элементов в кластеры |
Разделение на сегменты измерения потребителей на основе свойств элементов потребителей, продукции, покупаемой потребителями, и суммы денег, которую тратят потребители. |
Алгоритм кластеризации (Майкрософт) |
Поиск требуемых или нестандартных элементов |
Определение требуемых или нестандартных запасов в измерении запасов на основе продаж, прибыли, местоположения и размера запасов. |
Алгоритм дерева принятия решений (Майкрософт) |
Поиск требуемых или нестандартных ячеек |
Определение продаж магазина, отличающихся от обычных трендов. |
Алгоритм временных рядов (Майкрософт) |
Мастер интеллектуального анализа данных помогает выполнить процедуру по созданию структуры для новой модели интеллектуального анализа данных:
выбор типа источника данных. В данном случае — куб;
Примечание Куб OLAP должен быть внутри той же базы данных, что и структура интеллектуального анализа данных. Нельзя использовать куб, созданный надстройкой PowerPivot для Excel, в качестве источника интеллектуального анализа данных.
выбор алгоритма;
выбор измерения исходного куба;
выбор ключевого варианта;
выбор столбцов варианта;
выбор вложенных таблиц;
выбор использования для каждого столбца: прогнозируемый, входной или ключевой;
задание типов содержимого столбца;
разделение исходного куба;
создание необязательного проверочного набора;
присвоение имени и сохранение новой структуры интеллектуального анализа данных и связанной с ней модели интеллектуального анализа данных.
На последней странице мастера можно задать следующие параметры.
Разрешить детализацию
Создать измерение модели интеллектуального анализа данных
Создать куб с использованием измерения модели интеллектуального анализа данных
Если выбран параметр создания нового измерения модели интеллектуального анализа данных в исходном кубе, можно включить сведения, найденные алгоритмом интеллектуального анализа данных в источнике данных OLAP. Создание измерения модели интеллектуального анализа данных позволяет просматривать содержимое модели, хранящееся в виде измерения. Этот режим доступен для моделей, построенных с помощью алгоритма кластеризации (Майкрософт), алгоритма дерева принятия решений (Майкрософт) и алгоритма взаимосвязей (Майкрософт).
Если выбрать параметр для создания нового куба, куб определяется по базе данных, включающей измерение модели интеллектуального анализа данных и, при необходимости, любые связанные измерения. Это позволит выполнить срез фактических данных в иерархии, найденных моделью интеллектуального анализа данных.
Дополнительные сведения см. в разделахАлгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных), Столбцы модели интеллектуального анализа данных, Столбцы структуры интеллектуального анализа данных, Типы данных (интеллектуальный анализ данных), Типы содержимого (интеллектуальный анализ данных)
Включение детализации и контрольных данных
При создании структуры интеллектуального анализа данных необходимо также задать два важных параметра для работы с данными: контрольные данные и детализация. Контрольные данные позволяют секционировать данные в структуре интеллектуального анализа данных в обучающий набор и проверочный набор для использования со всеми моделями, связанными с этой структурой. Дополнительные сведения см. в разделе Секционирование данных на обучающий и проверочный наборы данных (службы Analysis Services — интеллектуальный анализ данных).
Детализация позволяет просматривать данные источника в структуре интеллектуального анализа данных с помощью запросов к модели интеллектуального анализа данных. Это удобно при просмотре результатов модели интеллектуального анализа данных, когда нужно просмотреть дополнительные подробные сведения из базовых вариантов. Например, можно находить контактные сведения, варианты, которые использовались при обучении определенного кластера и т. д. Чтобы использовать детализацию, необходимо включить ее при создании структуры интеллектуального анализа данных. Позднее детализацию включить нельзя. Дополнительные сведения см. в разделе Использование детализации в моделях и структурах интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
См. также
Основные понятия
Управление моделями интеллектуального анализа данных в конструкторе интеллектуального анализа данных