Поделиться через


Логическая архитектура (службы Analysis Services — интеллектуальный анализ данных)

Интеллектуальный анализ данных — это процесс, сопряженный с взаимодействием нескольких компонентов.

  • Выполняется доступ к источникам данных в базе данных SQL Server или любому другому источнику данных, используемому для обучения, тестирования и прогнозирования.

  • Структуры и модели интеллектуального анализа данных определяются с помощью SQL Server Data Tools (SSDT) или Visual Studio.

  • Вы управляете объектами интеллектуального анализа данных и создаете прогнозы и запросы с помощью SQL Server Management Studio.

  • Законченное решение развертывается в экземпляре служб Analysis Services.

Процесс создания подобных объектов решения описан в других разделах документации. Дополнительные сведения см. в разделе Решения интеллектуального анализа данных.

Исходные данные для интеллектуального анализа

Данные, используемые в интеллектуальном анализе, не хранятся в решении по интеллектуальному анализу данных. Сохраняются только привязки. Данные могут располагаться в базе данных, созданной в предыдущей версии SQL Server, в системе CRM или даже в неструктурированном файле. Во время обучения структуры или модели путем обработки создается статистическая сводка данных, которая сохраняется в кэше. Кэш можно сохранить для использования в дальнейших операциях или удалить после обработки. Дополнительные сведения см. в разделе Структуры интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Вы объединяете разрозненные данные в объекте представления источника данных служб Analysis Services, который предоставляет уровень абстракции поверх источника данных. Можно задавать соединения между таблицами и добавлять таблицы, имеющие связь «многие к одному», чтобы создавать столбцы вложенных таблиц. Определения этих объектов (источника данных и представления источников данных) хранятся в рамках решения в файлах с расширениями DS и DSV. Дополнительные сведения о создании и использовании источников данных и представлений источников данных служб Analysis Services см. в статье Поддерживаемые источники данных (многомерные службы SSAS).

Для определения и изменения источников данных и представлений источников данных также используются объекты AMO и XML для аналитики. Дополнительные сведения о работе с этими объектами программным способом см. в статье Обзор логической архитектуры (службы Analysis Services — многомерные данные).

Структуры интеллектуального анализа данных

Структура интеллектуального анализа данных — это логический контейнер, определяющий область данных, на основе которой строятся модели интеллектуального анализа данных. Одна структура интеллектуального анализа данных может поддерживать несколько моделей интеллектуального анализа данных.

Когда необходимо использовать данные в решении по интеллектуальному анализу данных, службы Analysis Services считывают данные из источника и создают кэш для агрегатных выражений и других используемых данных. По умолчанию этот кэш сохраняется, что позволяет многократно использовать обучающие данные для поддержки дополнительных моделей. Чтобы удалить кэш, измените значение свойства CacheMode в объекте структуры интеллектуального анализа данных на ClearAfterProcessing. Дополнительные сведения см. в разделе Классы интеллектуального анализа данных объектов AMO.

SQL Server 2014 Analysis Services (SSAS) также предоставляет возможность разделить данные на наборы данных для обучения и тестирования, чтобы можно было протестировать модели интеллектуального анализа данных на репрезентативном случайно выбранном наборе данных. В действительности данные не хранятся отдельно. Данные о вариантах в кэше структуры помечаются свойством, которое показывает, используется ли тот или иной вариант для обучения или для тестирования. Если кэш удаляется, то эти данные получить невозможно.

Дополнительные сведения см. в разделе Структуры интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Структура интеллектуального анализа данных может содержать вложенные таблицы. Вложенная таблица содержит дополнительные сведения о варианте, который моделируется в первичной таблице данных. Дополнительные сведения см. в разделе Вложенные таблицы (службы Analysis Services — интеллектуальный анализ данных)

Модели интеллектуального анализа данных

До обработки модель интеллектуального анализа данных представляет собой просто набор свойств метаданных. Эти свойства определяют структуру интеллектуального анализа данных, задают алгоритм интеллектуального анализа данных и определяют набор значений параметров и фильтров, управляющих обработкой данных. Дополнительные сведения см. в разделе Модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Во время обработки модели обучающие данные, хранящиеся в кэше структуры интеллектуального анализа данных, используются для построения закономерностей в зависимости от статистических свойств данных и от эвристических методов, определенных в алгоритме и его параметрах. Это называется обучением модели.

Результатом обучения является набор сводных данных, который входит в содержимое модели. Этот набор описывает обнаруженные закономерности и включает правила, по которым создаются прогнозы. Дополнительные сведения см. в разделе Содержимое модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

При некоторых условиях также возможен экспорт логической структуры модели в файл, где формулы и привязки данных модели представлены в стандартном формате PMML (язык разметки прогнозирующих моделей). Такую логическую структуру можно импортировать в другие системы, использующие язык PMML, и описанная на этом языке модель будет использоваться для прогнозирования. Дополнительные сведения см. в разделе Общие сведения об инструкции расширения интеллектуального анализа данных SELECT.

Пользовательские объекты интеллектуального анализа данных

Другие объекты, используемые в контексте проекта интеллектуального анализа данных, в том числе диаграммы точности и прогнозирующие запросы, не сохраняются в решении, но их можно включить в скрипты на языке ASSL или построить с помощью объектов AMO.

Кроме того, можно расширить службы и функции, доступные в экземпляре служб Analysis Services, добавив следующие пользовательские объекты:

Пользовательские сборки
Сборки .NET можно определять на любом языке, совместимом с CLR или COM, а затем регистрировать в экземпляре SQL Server. Файлы сборки загружаются из места, определенного приложением, а копия этих файлов сохраняется на сервере вместе с данными. Копия файла сборки используется для загрузки сборки при каждом запуске службы.

Дополнительные сведения см. в разделе Управление сборками многомерной модели.

Пользовательские хранимые процедуры
Интеллектуальный анализ данных служб Analysis Services поддерживает использование хранимых процедур для работы с объектами интеллектуального анализа данных. Можно создавать собственные хранимые процедуры для расширения функций и упрощения работы с данными, возвращаемыми прогнозирующими запросами и запросами содержимого.

Определение хранимых процедур

Для выполнения перекрестной проверки поддерживаются следующие хранимые процедуры.

Хранимые процедуры интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

Кроме того, службы Analysis Services содержат множество системных хранимых процедур, которые используются для интеллектуального анализа данных. Системные хранимые процедуры предназначены для внутреннего использования, но также могут оказаться полезными в качестве средства быстрого доступа к функциям. Корпорация Майкрософт оставляет за собой право изменять эти хранимые процедуры в случае необходимости, и поэтому для использования в рабочей среде рекомендуется создавать запросы с помощью расширений интеллектуального анализа данных, объектов AMO или XML для аналитики.

Пользовательские подключаемые алгоритмы
Службы Analysis Services предоставляют механизм для создания собственных алгоритмов, а затем добавления алгоритмов в качестве новой службы интеллектуального анализа данных в экземпляр сервера.

Для связи с подключаемыми алгоритмами в службах Analysis Services используются COM-интерфейсы. Дополнительные сведения о реализации новых алгоритмов см. в разделе Plugin Algorithms.

Перед использованием каждого нового алгоритма его необходимо зарегистрировать. Чтобы зарегистрировать алгоритм, добавьте необходимые метаданные для алгоритмов в файл .ini экземпляра служб Analysis Services. Эти данные нужно добавить в каждый экземпляр, где планируется использовать новый алгоритм. После добавления алгоритма можно перезапустить экземпляр и использовать набор строк схемы MINING_SERVICES для просмотра нового алгоритма, включая параметры и поставщики, поддерживаемые алгоритмом.

См. также:

Обработка объектов многомерной модели
Справочник по расширениям интеллектуального анализа данных