Поделиться через


Создание структуры интеллектуального анализа данных OLAP

Применимо к: SQL Server 2019 и более ранних версий Analysis Services Azure Analysis Services Fabric/Power BI Premium

Важно!

Интеллектуальный анализ данных не рекомендуется использовать в службах SQL Server 2017 Analysis Services, а в SQL Server 2022 Analysis Services его поддержка прекращена. Документация не обновляется для устаревших и неподдерживаемых функций. Дополнительные сведения см. в статье об обратной совместимости служб Analysis Services.

Создание модели интеллектуального анализа данных на основе куба OLAP или другого многомерного хранилища данных имеет множество преимуществ. Решение OLAP содержит огромное количество данных, которые уже хорошо организованы, очищены и правильно отформатированы. Однако сложность данных такова, что пользователи вряд ли смогут найти значительные шаблоны путем случайного перебора. Интеллектуальный анализ данных обеспечивает возможность выявления новых связей и принятия соответствующих решений.

В этом разделе содержатся сведения о создании структуры интеллектуального анализа OLAP, основанной на измерении и связанных мерах в существующем многомерном решении.

Requirements

Обзор процесса интеллектуального анализа данных OLAP

Сценарии использования интеллектуального анализа данных в решениях OLAP

Фильтры

Использование вложенных таблиц

Измерения интеллектуального анализа данных

Требования к структуре и моделям интеллектуального анализа OLAP

При разработке модели интеллектуального анализа OLAP источник данных должен уже существовать в базе данных, которая использовалась для построения куба. Нельзя подключиться к удаленному кубу и построить объекты интеллектуального анализа данных. Объекты куба должны быть доступны внутри одного решения вместе с базой данных и создаваемой структурой интеллектуального анализа.

Если оригинальные файлы проекта отсутствуют или их изменение нежелательно, то можно выбрать в Visual Studio флажок Импорт с сервера (многомерный режим или интеллектуальный анализ данных)для получения копии метаданных и объектов решения. После выполнения команды можно изменить цель развертывания, источники данных и работать с объектами кубов, не затрагивая существующие объекты.

Дополнительные сведения см. в разделе Импорт проекта интеллектуального анализа данных с помощью мастера импорта служб Analysis Services.

Обзор процесса интеллектуального анализа данных OLAP

Запустите мастер интеллектуального анализа данных, щелкнув правой кнопкой мыши узел Структуры интеллектуального анализа данных в Обозреватель решений и выбрав Создать структуру интеллектуального анализа данных. Мастер помогает выполнить следующие шаги по созданию структуры для новой структуры и модели.

  1. Выбор метода определения. Здесь в качестве типа источника данных выберите На основе существующего куба.

    Примечание

    Куб OLAP, используемый в качестве источника данных, должен существовать внутри одной базы данных вместе со структурой интеллектуального анализа, как было описано выше. Кроме того, нельзя использовать куб, созданный надстройкой Power Pivot для Excel, в качестве источника для интеллектуального анализа данных.

  2. Создание структуры интеллектуального анализа данных. Определите, что следует создавать: просто структуру или структуру с моделью интеллектуального анализа данных.

    Кроме того, необходимо выбрать соответствующий алгоритм анализа данных. Сведения о том, какой алгоритм лучше всего подходит для определенных задач, см. в разделе Hyperlink "ms-help://SQL111033/as_1devconc/html/ed1fc83b-b98c-437e-bf53-4ff001b92d64.htm" Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

  3. Выбор измерения исходного куба. Этот шаг соответствует выбору источника данных. Нужно выбрать одно измерение, содержащее наиболее важные данные, используемые для обучения модели. Данные можно будет добавить и позже или отфильтровать измерение.

  4. Выбор ключа варианта. В рамках выбранного измерения найдите атрибут (столбец), который будет служить уникальным идентификатором данных варианта.

    Как правило, столбец выбирается автоматически, но можно выбрать и другой столбец, если есть несколько ключей.

  5. Выбор столбцов уровня варианта. Здесь необходимо найти атрибуты из выбранного измерения и связанные меры, релевантные анализу. Этот шаг соответствует выбору столбцов из таблицы.

    Мастер автоматически включает для просмотра и выбора меры, созданные с помощью атрибутов из выбранного измерения.

    Например, если ваш куб содержит меру, которая вычисляет стоимость перевозки на основе географического расположения клиента и вы выбрали измерение Customer в качестве источника данных main для моделирования, эта мера будет предложена в качестве кандидата для добавления в модель. Будьте осторожны, добавляя слишком большое число мер, которые уже напрямую связаны с атрибутами, так как между столбцами уже существует одна явная связь. Сила ожидаемой корреляции может скрыть другие связи, которые могли быть выявлены в других случаях.

  6. Использование столбцов для модели. Для каждого атрибута или меры, добавленных в структуру, следует указать, будет ли атрибут использоваться для предсказания или в качестве входных данных. Если этот параметр не будет указан, то данные будут обработаны, но не будут учтены при анализе. Однако они будут доступны в качестве фоновых данных для последующей детализации.

  7. Добавить вложенные таблицы. Щелкните, чтобы добавить связанные таблицы. В диалоговом окне Выбор измерения группы мер можно выбрать одно из нескольких измерений, связанных с текущим измерением.

    Далее, в диалоговом окне Выбор ключа вложенной таблицы определите, каким образом новое измерение связано с измерением, содержащим данные варианта.

    В диалоговом окне Выбор столбцов вложенной таблицы выберите атрибуты и меры из нового измерения, которое будет использовано в анализе. Кроме того, нужно указать, будет ли вложенный атрибут использован для прогнозирования.

    После добавления всех вложенных атрибутов, вернитесь на страницу Указать использование столбца модели интеллектуального анализаи нажмите кнопку Далее.

  8. Определение содержимого и типа данных столбцов. К этому моменту были добавлены все данные, которые будут использованы в анализе, остается указать тип данных и тип содержимого для каждого атрибута.

    В модели OLAP нельзя автоматически выявлять типы данных, поскольку тип данных уже определен многомерным решением и не может быть изменен. Ключи также определяются автоматически. Дополнительные сведения см. в разделе Типы данных (интеллектуальный анализ данных).

    Тип содержимого , выбираемый для каждого столбца, который используется в модели, сообщает алгоритму, каким образом следует обрабатывать данные. Дополнительные сведения см. в разделе Типы контента (интеллектуальный анализ данных).

  9. Срез исходного куба. Здесь можно определить фильтры в кубе, чтобы выбрать только подмножество данных и обучить более целевые модели.

    Куб можно отфильтровать, выбрав измерение, уровень иерархии, содержащей используемые критерии, и введя условие, которое будет использоваться в качестве фильтра.

  10. Создание проверочного набора. На этой странице указывается, какой объем данных следует выделить для использования в тестировании модели. Если данные будут поддерживать несколько моделей, то разумно создать набор контрольных данных, чтобы тестировать все модели по одним и тем же данным.

    Дополнительные сведения см. в разделе Тестирование и проверка (интеллектуальный анализ данных).

  11. Завершение работы мастера. На этой странице задается имя новой структуры интеллектуального анализа данных и имя связанной модели интеллектуального анализа данных, а затем структура и модель сохраняются.

    На этой странице можно задать следующие параметры.

    • Разрешить детализацию

    • Создать измерение модели интеллектуального анализа данных

    • Создать куб с использованием измерения модели интеллектуального анализа данных

    Дополнительные сведения об этих параметрах см. далее в этом разделе Общие сведения об измерения интеллектуального анализа и детализации.

На данном этапе структура интеллектуального анализа данных и ее модель представляют собой лишь метаданные. Для получения результатов необходимо обработать структуру и модель.

Сценарии использования интеллектуального анализа данных с данными OLAP

Кубы OLAP часто содержат настолько большое количество элементов и измерений, что иногда бывает трудно понять, откуда следует начинать интеллектуальный анализ данных. Чтобы определить закономерности в организации данных куба, обычно определяется одно интересующее измерение, и затем начинают исследоваться связанные с ним закономерности. В следующей таблице содержится список нескольких обычных задач интеллектуального анализа данных OLAP, описывающих образцы сценариев, в которых можно применять эти задачи, и определяющих алгоритм интеллектуального анализа данных, используемый в каждой задаче.

Задача Пример сценария Алгоритм
Группировка элементов в кластеры Разделение на сегменты измерения потребителей на основе свойств элементов потребителей, продукции, покупаемой потребителями, и суммы денег, которую тратят потребители. Алгоритм кластеризации (Майкрософт)
Поиск требуемых или нестандартных элементов Определение требуемых или нестандартных запасов в измерении запасов на основе продаж, прибыли, местоположения и размера запасов. Алгоритм дерева принятия решений (Майкрософт)
Поиск требуемых или нестандартных ячеек Определение продаж магазина, отличающихся от обычных трендов. Алгоритм временных рядов (Майкрософт)
Поиск корреляций Идентифицируйте факторы, связанные с простоем сервера, включая регион, тип машины, ОС и дату покупки. Упрощенный алгоритм Байеса (Майкрософт)

Создание срезов куба и модели фильтрации

Создание среза куба во время построения модели похоже на создание фильтра для реляционной модели интеллектуального анализа данных. В реляционной модели фильтр для источника данных определяется в качестве предложения WHERE в инструкции SQL. В кубе нужно выбрать редактор для создания инструкции фильтра с помощью многомерных выражений.

Например, куб может содержать сведения о покупках продукции по всему миру, однако для маркетинговой кампании нужно создать модель на основе анализа клиентов-женщин в возрасте старше 30 лет, проживающих в Великобритании.

Для этого случая нужно создать два фильтра.

  • Для первого фильтра необходимо выбрать измерение География, иерархию для параметра Регион, а затем использовать список Выражение фильтра , чтобы выбрать "Соединенное Королевство" из возможных значений.

  • Для второго фильтра необходимо выбрать измерение Customer, выбрать атрибут Gender и выбрать "Female" в списке значений атрибутов.

После создания структуры интеллектуального анализа данных можно изменять как определение данных куба, так и критерии фильтра. Дополнительные сведения см. в разделе Фильтры для моделей интеллектуального анализа данных.

Как на вкладке Структура интеллектуального анализа данных , так и на вкладке Модель интеллектуального анализа данных можно добавить фильтр к существующей структуре интеллектуального анализа, нажав кнопку Определить срез куба. Диалоговое окно Срез куба позволяет построить действительное многомерное выражение фильтра, выбрав значение из раскрывающегося списка.

Предупреждение

Обратите внимание, что интерфейс для проектирования и просмотра кубов был изменен в SQL Server 2017 г. Дополнительные сведения см. в разделе Просмотр данных и метаданных в кубе.

Для куба можно добавить столько фильтров, сколько потребуется для получения данных, необходимых для модели интеллектуального анализа данных. Также можно определить срезы на конкретных срезах куба. Например, если в структуре содержатся две вложенные таблицы, основанные на продуктах, то можно ограничить одну таблицу мартом 2004 года, а другую — апрелем того же года. В результате получится модель, которую затем можно использовать для прогнозирования объема покупок в апреле на основании покупок, совершенных в марте.

Использование вложенных таблиц в модели интеллектуального анализа данных OLAP

Если для построения модели на основе данных куба используется мастер интеллектуального анализа данных, то можно добавить таблицы, указав имена связанных измерений и сопоставив атрибуты или меры для добавления в модель.

Если, например, основным измерением для данных варианта является "Клиент", то можно добавить в качестве связанного измерения измерение "Продукты", поскольку есть вероятность, что один клиент мог заказывать разные продукты в течение какого-то времени, а куб уже связывает каждого клиента с некоторым множеством продуктов через таблицы фактических заказов.

Вложенные таблицы добавляются на странице мастера Использование столбцов модели интеллектуального анализа данных путем нажатия кнопки Добавить вложенные таблицы. Открывается диалоговое окно, где можно выбрать связанное измерение, а также необходимые меры. Вариант и вложенные измерения должны быть связаны внешним ключом, при этом меры должны использовать один из атрибутов, уже включенных в вариант или вложенные таблицы. К сожалению, эти ограничения на самом деле не сильно сужают область, поэтому необходимо соблюдать осторожность при выборе только тех атрибутов, которые полезны для моделирования.

Для каждого атрибута или меры, добавляемых во вложенную таблицу, следует указать, будет ли использоваться вложенный атрибут для прогнозирования, выбрав параметр Прогнозируемый или Входные данные в диалоговом окне Выбор столбцов вложенной таблицы . Если один из параметров не будет указан, то данные будут добавлены в структуру интеллектуального анализа, но не будут использованы для анализа.

Для каждого атрибута и меры нужно также указать, будет ли атрибут дискретным, дискретизированным или непрерывным. Мастер предварительно выбирает значение по умолчанию на основе типа данных атрибута, однако может потребоваться их изменение, в зависимости от требований алгоритма. Если выбрать тип контента, несовместимый с выбранным алгоритмом (например, вы используете непрерывный числовой тип с упрощенной моделью Байеса), вы не получите сообщение об ошибке, пока не попытаетесь обработать модель.

После задания этих параметров мастер добавит вложенную таблицу в таблицу вариантов. Именем по умолчанию для вложенной таблицы является имя вложенного измерения, но можно переименовать вложенную таблицу и ее столбцы. Для добавления нескольких вложенных таблиц в структуру интеллектуального анализа данных следует повторить эту процедуру.

Возможность использования данных вложенной таблицы — это очень мощная функция интеллектуального анализа данных SQL Server, при этом в кубе возможности использования связанных подмножеств данных практически не ограничены.

Общие сведения об измерения интеллектуального анализа и детализации

Параметр Разрешить детализациюпозволяет отправлять запросы к данным базового куба во время просмотра модели. Данные не содержатся в новом измерении интеллектуального анализа данных, но SQL Server Analysis Services база данных может использовать привязки данных для получения информации из исходного куба.

Параметр Создание измерения модели интеллектуального анализа данныхпозволяет сформировать новое измерение внутри существующего куба, содержащего шаблоны, выявленные алгоритмом. Иерархия внутри нового измерения определяется в основном по типу модели. Например, представление модели кластеризации является в целом плоским, при этом узел «Все» находится наверху иерархии, а все кластеры — на следующем уровне. В отличие от этого измерение, создаваемое для модели дерева решений, может иметь очень глубокую иерархию, представляющую ответвления дерева.

Параметр Создание куба с помощью измерения модели интеллектуального анализа данныхпозволяет экспортировать новое измерение интеллектуального анализа данных в новый куб. Любые объекты, необходимые для детализации в измерении интеллектуального анализа данных, включаются автоматически.

Предупреждение

Создание измерений интеллектуального анализа данных поддерживается только следующими типами моделей: модели на основе алгоритма кластеризации (Майкрософт), алгоритм деревьев принятия решений (Майкрософт) или алгоритм взаимосвязей (Майкрософт).

См. также:

Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
Столбцы структуры интеллектуального анализа данных
Столбцы модели интеллектуального анализа данных
Свойства модели интеллектуального анализа данных
Свойства структур интеллектуального анализа данных и их столбцов