Поделиться через


Мастер интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

Мастер интеллектуального анализа данных в Microsoft SQL Server Analysis Services запускается при каждом добавлении новой структуры интеллектуального анализа данных в проект интеллектуального анализа данных. Мастер помогает выбрать источник данных и создать представление источника данных, которое определяет данные, используемые для анализа, а также создать начальную модель.

На последнем этапе работы мастера можно разделить данные на обучающий и проверочный наборы и включить такие функции, как детализация.

Что нужно знать до начала работы

Прежде чем запускать мастер, необходимо ответить на следующие вопросы.

  • Как будут создаваться структура и модель интеллектуального анализа данных: на основе реляционной базы данных или на основе существующего куба в базе данных OLAP?

  • Какие столбцы содержат ключи, однозначно идентифицирующие запись варианта.

  • Какие столбцы или атрибуты будут использоваться в прогнозе? Какие столбцы или атрибуты подходят для использования в качестве входных данных для анализа?

  • Какой алгоритм использовать? Алгоритмы, предоставляемые в SQL Server Analysis Services, имеют разные характеристики и дают разные результаты. К счастью, вы не ограничены одной моделью для каждого набора данных, поэтому экспериментируйте, добавляя новые модели.

  • Потребуется ли проверка моделей на унифицированном наборе данных? Если да, то можно отложить некоторые данные для проверки. Можно выбрать процент и, если потребуется, указать количество строк.

Запуск мастера интеллектуального анализа данных

Чтобы использовать мастер интеллектуального анализа данных, необходимо открыть решение в SQL Server Data Tools (SSDT), которое содержит по крайней мере один проект интеллектуального анализа данных или OLAP.

  • Если решение готово для интеллектуального анализа данных, достаточно щелкнуть правой кнопкой мыши узел Структуры интеллектуального анализа данных в обозревателе решений и выбрать пункт Создать структуру интеллектуального анализа данных , чтобы запустить мастер интеллектуального анализа данных.

  • Если в решении еще нет проектов, можно добавить новый проект интеллектуального анализа данных. В меню Файл выберите команду Создать, а затем пункт Проект. Обязательно выберите шаблон Проект многомерных данных и интеллектуального анализа данных служб Analysis Services.

  • Используйте мастер импорта служб Analysis Services для получения метаданных из существующего решения интеллектуального анализа данных. Однако выбрать отдельные объекты для импорта невозможно. Импортируется вся база данных, включая кубы, представления источников данных и т. д. Также обратите внимание, что новое решение, созданное с помощью импорта, автоматически настраивается на использование локальной базы данных по умолчанию. Перед обработкой или просмотром объектов может потребоваться изменить его на другой экземпляр. При импорте из предыдущей версии служб Analysis Services может потребоваться обновить ссылки на поставщиков.

Затем создается структура интеллектуального анализа данных и одна модель интеллектуального анализа данных, связанная с этой структурой. Можно также создать только структуру интеллектуального анализа данных и добавить модели позже, но обычно проще сначала создать проверочную модель.

Реляционные и Модели интеллектуального анализа данных OLAP

Теперь следует сделать следующий важный выбор: использовать реляционный источник данных или создать модель на основе многомерных данных (OLAP).

В этой точке мастер интеллектуального анализа данных разделяется на две ветви в зависимости от того, содержатся данные в реляционном источнике данных или в кубе. Все остальное, кроме процесса выбора данных, совпадает с выбором алгоритма, возможностью добавления контрольного набора данных и т. д., но выбор данных куба немного сложнее, чем использование реляционных данных. (Если модель создается на основе куба, в конце будет несколько дополнительных параметров.)

Подробное описание каждого параметра см. в следующих разделах:

Создание реляционной структуры интеллектуального анализа данных
Описывает решения, которые необходимо принять при создании модели интеллектуального анализа данных на основе реляционных данных.

Создание структуры интеллектуального анализа данных OLAP
Описывает дополнительные параметры и решения, которые необходимо принять, если выбираются данные куба OLAP.

Примечание

Для интеллектуального анализа данных наличие куба или базы данных OLAP не требуется. Для интеллектуального анализа данных рекомендуется использовать реляционную таблицу или источник данных, если только данные уже не хранятся в кубе или если необходимо провести интеллектуальный анализ измерений OLAP или результатов агрегатов или вычислений OLAP.

Выбор алгоритма

Теперь необходимо решить, какой алгоритм использовать для обработки данных. Это решение может быть сложным. Каждый алгоритм, предоставляемый в службах Analysis Services, имеет разные функции и дает разные результаты, поэтому вы можете поэкспериментировать и попробовать несколько разных моделей, прежде чем определить, какая из них наиболее подходит для ваших данных и бизнес-проблемы. Задачи, для которых лучше всего подходит каждый алгоритм, см. в разделе

Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

В любом случае можно создавать разные модели с разными алгоритмами или менять параметры алгоритмов для создания разных моделей. Вы не ограничены в выборе алгоритма, и рекомендуется создать несколько моделей с одними и теми же данными.

Определение данных для модели

Помимо выбора данных из определенного источника необходимо указать, какая таблица в представлении источника данных содержит данные вариантов. Таблица вариантов будет использоваться для обучения модели интеллектуального анализа данных, поэтому она должна содержать сущности, которые нужно анализировать, например сведения о заказчиках и соответствующие демографические сведения. Каждый вариант должен быть уникальным и идентифицироваться по ключу варианта.

Помимо указания таблицы вариантов в данные можно включить вложенные таблицы . Вложенная таблица обычно содержит дополнительные сведения о сущностях таблицы вариантов. Это могут быть транзакции, осуществляемые заказчиком, или атрибуты, имеющие связь с сущностью «многие к одному». Например, вложенная таблица, присоединенная к таблице вариантов Customers , может содержать список покупок каждого заказчика. В модели, анализирующей трафик веб-сайта, вложенная таблица может содержать последовательности страниц, которые посетил пользователь. Дополнительные сведения см. в разделе Вложенные таблицы (службы Analysis Services — интеллектуальный анализ данных)

Дополнительные функции

Мастер интеллектуального анализа данных содержит следующие дополнительные функции, помогающие выбрать данные и правильно настроить источники данных.

  • Автоматическое определение типов данных. Мастер исследует уникальность и распределение значений в столбцах, а затем рекомендует наилучший тип данных и тип использования данных. Эти предложения можно отвергнуть и выбрать значения из списка.

  • Предложения по переменным. Можно щелкнуть диалоговое окно и запустить анализатор, который вычисляет корреляцию столбцов, включенных в модель, и определяет столбцы, оптимально подходящие для прогнозирования выходного атрибута, на основании текущей конфигурации модели. Эти предложения можно отвергнуть и ввести другие значения.

  • Выбор компонентов. Большинство алгоритмов автоматически обнаруживает столбцы, наиболее подходящие для прогнозирования, и используют в первую очередь эти столбцы. В столбцах с большим количеством значений используется функция выбор компонентов для уменьшения количества элементов связи данных и повышения вероятности получения значимой закономерности. На выбор компонентов можно повлиять с помощью параметров модели.

  • Автоматическое создание срезов куба. Если модель интеллектуального анализа данных основана на источнике данных OLAP, автоматически предоставляется возможность получения срезов модели с помощью атрибутов куба. Это удобно, когда модели создаются на основе подмножеств данных куба.

Завершение работы мастера

На последнем шаге выполнения мастера указываются имена структуры интеллектуального анализа данных и связанной с ней модели интеллектуального анализа данных. В зависимости от созданного типа модели могут предоставляться следующие возможности.

  • Если выбран параметр Разрешить детализацию, в модели включается функция детализации . Если детализация включена, пользователи с соответствующими разрешениями могут просматривать исходные данные, которые использовались для построения модели.

  • Если создается модель OLAP, можно установить флажок Создать новый куб интеллектуального анализа данныхили Создать измерение модели интеллектуального анализа данных. Оба варианта упрощают просмотр готовой модели и детализацию базовых данных.

После завершения работы мастера интеллектуального анализа данных с помощью конструктора интеллектуального анализа данных можно изменить структуру и модели интеллектуального анализа данных, просмотреть точность модели, просмотреть характеристики структуры и моделей или выполнить прогнозирование с использованием этих моделей.

К началу

Узнать больше о решениях, которые необходимо принять при создании модели интеллектуального анализа данных, можно по следующим ссылкам:

Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

Типы содержимого (интеллектуальный анализ данных)

Типы данных (интеллектуальный анализ данных)

Выбор компонентов (интеллектуальный анализ данных)

Отсутствующие значения (службы Analysis Services — интеллектуальный анализ данных)

Детализация моделей интеллектуального анализа данных

См. также:

Средства интеллектуального анализа данных
Решения для интеллектуального анализа данных