Содержимое модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
После создания и обработки модели интеллектуального анализа данных с использованием данных из базовой структуры интеллектуального анализа данных эта модель считается завершенной и содержит содержимое модели интеллектуального анализа данных. На основе этого содержимого производится создание прогнозов и анализ данных.
Модель интеллектуального анализа данных включает метаданные о модели, статистику по данным, а также закономерности, выявленные алгоритмом интеллектуального анализа данных. В зависимости от применяемого алгоритма содержимое модели может включать формулы регрессии, определения правил, наборы элементов, весовые коэффициенты и другие статистические данные.
Но независимо от применяемого алгоритма содержимое модели интеллектуального анализа данных представляется стандартной структурой. Вы можете просмотреть структуру в средстве просмотра универсального дерева содержимого (Майкрософт), предоставленном в SQL Server Data Tools (SSDT), а затем переключиться на одно из пользовательских средств просмотра, чтобы увидеть, как информация интерпретируется и отображается графически для каждого типа модели. К модели интеллектуального анализа данных можно также создавать запросы при помощи любого клиента, поддерживающего набор строк схемы MINING_MODEL_CONTENT. Дополнительные сведения см. в статье Задачи и инструкции по запросам интеллектуального анализа данных.
В этом разделе содержится описание базовой структуры содержимого для всех типов моделей интеллектуального анализа данных. В нем описаны все типы узлов, общие для всех моделей интеллектуального анализа данных, а также приведены рекомендации по интерпретации этих сведений.
Структура содержимого модели интеллектуального анализа данных
Содержимое модели интеллектуального анализа данных по типу алгоритма
Средства просмотра содержимого модели интеллектуального анализа данных
Средства запроса содержимого модели интеллектуального анализа данных
Структура содержимого модели интеллектуального анализа данных
Содержимое каждой из моделей представлено в виде последовательности узлов. Узлом называется объект модели интеллектуального анализа данных, который содержит метаданные и сведения о фрагменте модели. Узлы упорядочены в виде иерархии. Смысл иерархии и порядок узлов в ней зависят от применяемого алгоритма. Например, при создании модели дерева принятия решений она будет содержать несколько деревьев, выходящих из корневого элемента модели. Модель нейронной сети может содержать одну или несколько сетей, а также узел статистики.
Первый узел любой модели называется корневым узломили родительским узлом модели. Корневой узел (NODE_TYPE = 1) есть в каждой модели. Как правило, он содержит метаданные о модели и дочерние узлы, но может также содержать некоторые дополнительные сведения о выявленных моделью закономерностях.
Число дочерних узлов корневого узла зависит от алгоритма, применявшегося при создании модели. Дочерние узлы имеют разное назначение и содержат разные данные. Это зависит от алгоритма, сложности и уровня вложенности данных.
Узлы в содержимом модели интеллектуального анализа данных
В модели интеллектуального анализа данных узел является универсальным контейнером, в котором хранится фрагмент данных модели или ее части. Все узлы имеют одинаковую структуру. Они содержат столбцы, определенные набором строк схемы интеллектуального анализа данных. Дополнительные сведения см. в разделе Набор строк DMSCHEMA_MINING_MODEL_CONTENT.
Каждый узел содержит метаданные об узле, в том числе уникальный идентификатор в пределах модели, идентификатор родительского узла и число дочерних узлов. Метаданные идентифицируют модель, в которую входит данный узел, а также каталог базы данных, в котором хранится эта модель. В зависимости от типа алгоритма, применяемого для создания модели, метаданные могут содержать следующие дополнительные сведения.
Число вариантов в обучающих данных, которые поддерживают прогнозируемое значение.
Статистика — среднее, стандартное отклонение и дисперсия.
Коэффициенты и формулы.
Определения правил и боковых указателей.
XML-фрагменты, описывающие часть модели.
Список типов узлов в содержимом интеллектуального анализа данных
В следующей таблице перечислены различные типы узлов, создаваемых в моделях интеллектуального анализа данных. Поскольку алгоритмы обрабатывают данные по-разному, для каждой из моделей создаются только определенные типы узлов. После смены алгоритма типы узлов также могут измениться. Кроме этого, при повторной обработке модели может измениться содержимое каждого из узлов.
Примечание
Если вы используете службу интеллектуального анализа данных, отличную от служб SQL Server 2014 Analysis Services (SSAS), или создаете собственные подключаемые алгоритмы, могут быть доступны дополнительные пользовательские типы узлов.
NODE_TYPE ID | Метка узла | Содержимое узла |
---|---|---|
1 | Моделирование | Метаданные и корневой узел содержимого. Все типы моделей. |
2 | Дерево | Корневой узел дерева классификации. Модели дерева принятия решений. |
3 | Interior | Внутренняя узловая точка дерева. Модели дерева принятия решений. |
4 | Distribution | Конечный узел дерева. Модели дерева принятия решений. |
5 | Кластер | Кластер, выявленный алгоритмом. Модели кластеризации и модели кластеризации последовательностей. |
6 | Неизвестно | Неизвестный тип узла. |
7 | ItemSet | Набор элементов, выявленный алгоритмом. Модели взаимосвязей или модели кластеризации последовательностей. |
8 | AssociationRule | Правило взаимосвязи, выявленное алгоритмом. Модели взаимосвязей или модели кластеризации последовательностей. |
9 | PredictableAttribute | Прогнозируемый атрибут. Все типы моделей. |
10 | InputAttribute | Входной атрибут. Деревья принятия решений и модели упрощенного алгоритма Байеса. |
11 | InputAttributeState | Статистика о состоянии входного атрибута. Деревья принятия решений и модели упрощенного алгоритма Байеса. |
13 | Последовательность | Верхний узел компонента марковской модели в кластере последовательностей. Модели кластеризации последовательностей. |
14 | Переход | Марковская матрица переходов. Модели кластеризации последовательностей. |
15 | TimeSeries | Узел дерева временных рядов (кроме корневого). Только модель временных рядов. |
16 | TsTree | Корневой узел дерева временных рядов, который соответствует прогнозируемому временному ряду. Модели временных рядов, созданные с параметром MIXED. |
17 | NNetSubnetwork | Единичная подсеть. Модели нейронных сетей. |
18 | NNetInputLayer | Группа, содержащая узлы входного слоя. Модели нейронных сетей. |
19 | NNetHiddenLayer | Группа, содержащая узлы, которые описывают скрытый слой. Модели нейронных сетей. |
21 | NNetOutputLayer | Группа, содержащая узлы выходного слоя. Модели нейронных сетей. |
21 | NNetInputNode | Узел во входном слое, который соответствует входному атрибуту с соответствующими состояниями. Модели нейронных сетей. |
22 | NNetHiddenNode | Узел в скрытом слое. Модели нейронных сетей. |
23 | NNetOutputNode | Узел в выходном слое. Этот узел обычно соответствует выходному атрибуту и соответствующим состояниям. Модели нейронных сетей. |
24 | NNetMarginalNode | Граничная статистика по обучающему набору. Модели нейронных сетей. |
25 | RegressionTreeRoot | Корневой узел дерева регрессии. Модели линейной регрессии и модели дерева принятия решений, содержащие непрерывные входные атрибуты. |
26 | NaiveBayesMarginalStatNode | Граничная статистика по обучающему набору. Модели упрощенного алгоритма Байеса. |
27 | ArimaRoot | Корневой узел модели ARIMA. Модели временных рядов, использующие алгоритм ARIMA. |
28 | ArimaPeriodicStructure | Периодическая структура модели ARIMA. Модели временных рядов, использующие алгоритм ARIMA. |
29 | ArimaAutoRegressive | Коэффициент авторегрессии для единичного терма модели ARIMA. Модели временных рядов, использующие алгоритм ARIMA. |
30 | ArimaMovingAverage | Коэффициент скользящего среднего для единичного терма модели ARIMA. Модели временных рядов, использующие алгоритм ARIMA. |
1000 | CustomBase | Начальная точка для пользовательских типов узлов. Пользовательский тип узла должен быть целым числом, значение которого больше этой константы. Любые модели, создаваемые с использованием пользовательских подключаемых алгоритмов. |
Идентификатор, имя, заголовок и описание узла
Корневой узел для любой модели всегда имеет уникальный идентификатор (NODE_UNIQUE_NAME) со значением 0. Идентификаторы узлов назначаются автоматически службами Analysis Services и не могут быть изменены.
Корневой узел каждой модели содержит также некоторые основные метаданные о модели. Они описывают базу данных Analysis Services, где хранится модель (MODEL_CATALOG), схему (MODEL_SCHEMA) и имя модели (MODEL_NAME). Эти сведения дублируются во всех узлах модели, поэтому для доступа к ним нет необходимости запрашивать корневой узел.
Помимо уникального идентификатора, каждый узел имеет имя (NODE_NAME). Оно создается алгоритмом автоматически для отображения и не может быть изменено.
Примечание
Алгоритм кластеризации (Майкрософт) позволяет пользователям назначать каждому из кластеров понятные имена. Однако эти имена не сохраняются на сервере, поэтому после повторной обработки модели алгоритм сформирует их заново.
Алгоритм автоматически формирует для каждого из узлов заголовок и описание , которые выполняют функцию меток, давая пользователю представление о содержимом узла. Текст, формируемый для каждого из этих полей, зависит от типа модели. В некоторых случаях имя, заголовок и описание могут содержать один и тот же текст, но в некоторых моделях описание может действительно содержать дополнительные сведения. Дополнительные сведения о реализации см. в разделе, посвященному соответствующему типу модели.
Примечание
Сервер Analysis Services поддерживает переименование узлов только в том случае, если пользовательский подключаемый алгоритм, с помощью которого была построена модель, поддерживает переименование. Эта возможность реализуется перегрузкой методов при создании подключаемого алгоритма.
Родительские и дочерние узлы и количество элементов в узлах
Связь между родительским и дочерними узлами в древовидной структуре определяется значением столбца PARENT_UNIQUE_NAME. Это значение хранится в дочернем узле и содержит идентификатор родительского узла. Ниже приведено несколько примеров, демонстрирующих использование этих данных.
Если PARENT_UNIQUE_NAME имеет значение NULL, то узел является корневым узлом модели.
Если PARENT_UNIQUE_NAME имеет значение 0, то узел должен быть непосредственным потомком корневого узла модели. Это вызвано тем, что корневой узел всегда имеет идентификатор 0.
Для поиска родителей и потомков узла можно применять функции в DMX-запросе. Дополнительные сведения об этих функциях см. в разделе Запросы интеллектуального анализа данных.
Количеством элементов называют число элементов в наборе. В контексте обработанной модели интеллектуального анализа данных количество элементов указывает на число дочерних узлов, имеющихся у некоторого узла. Например, если в модели дерева принятия решений есть узел [Годовой доход], который имеет два дочерних узла — условие «[Годовой доход] = Высокий» и условие «[Годовой доход] = Низкий», — то значение CHILDREN_CARDINALITY для узла [Годовой доход] будет равно двум.
Примечание
В службах Analysis Services при вычислении кратности узла учитываются только непосредственные дочерние узлы. Однако при создании пользовательского подключаемого алгоритма подсчет CHILDREN_CARDINALITY можно переопределить. Например, эта возможность может оказаться полезной в тех случаях, когда необходимо подсчитать общее число потомков, а не только непосредственных дочерних узлов.
Хотя количество элементов для всех моделей подсчитывается одинаково, интерпретация этого значения зависит от типа модели. Например, в модели кластеризации количество элементов корневого узла указывает на общее число обнаруженных кластеров. В других моделях количество элементов может иметь фиксированное значение в зависимости от типа узла. Дополнительные сведения об интерпретации количества элементов см. в разделе для соответствующего типа модели.
Примечание
Некоторые модели, в частности созданные с использованием алгоритма нейронной сети (Майкрософт), включают дополнительные типы узлов, содержащие описательную статистику по обучающим данным для всей модели. Эти узлы по определению не могут иметь дочерних узлов.
распределение узла
Столбец NODE_DISTRIBUTION содержит вложенную таблицу, которая для многих узлов содержит подробные и важные сведения о закономерностях, выявленных алгоритмом. Точные статистические данные в этой таблице зависят от типа модели, положения узла в дереве, а также от того, является прогнозируемый атрибут непрерывным числовым или дискретным значением. Они могут включать минимальное и максимальное значение атрибута, назначенные весовые коэффициенты, количество вариантов в узле, коэффициенты, используемые в формулах регрессии, а также статистические меры (например, стандартное отклонение и дисперсия). Дополнительные сведения об интерпретации распределения узла см. в разделе, посвященном соответствующему типу модели.
Примечание
Таблица NODE_DISTRIBUTION для некоторых типов узлов может оказаться пустой. Например, некоторые узлы предназначены только для организации коллекции дочерних узлов, которые содержат подробные статистические сведения.
Вложенная таблица NODE_DISTRIBUTION всегда содержит следующие столбцы. Содержимое каждого из них зависит от типа модели. Дополнительные сведения о типах моделей см. в разделе Содержимое модели интеллектуального анализа данных по типам алгоритмов.
ATTRIBUTE_NAME
Содержимое зависит от алгоритма. Здесь может содержаться имя столбца, например прогнозируемый атрибут, правило, набор элементов или фрагмент внутренних данных алгоритма (например, фрагмент формулы).
Кроме того, этот столбец может содержать пару «атрибут-значение».
ATTRIBUTE_VALUE
Значение атрибута, имя которого содержится в столбце ATTRIBUTE_NAME.
Если именем атрибута является столбец, то в самом простом случае ATTRIBUTE_VALUE содержит одно из дискретных значений для этого столбца.
В зависимости от значений, переданных алгоритмом, столбец ATTRIBUTE_VALUE может также содержать флаг, который определяет, существует ли значение для атрибута (Existing
) или же оно равно значению NULL (Missing
).
Например, если модель предназначена для поиска клиентов, приобретавших определенную позицию как минимум один раз, то столбец ATTRIBUTE_NAME может содержать пару «атрибут-значение», которая определяет нужную позицию (например, Model = 'Water bottle'
), а столбец ATTRIBUTE_VALUE будет содержать только ключевое слово — Existing
или Missing
.
Псевдоним
Количество вариантов, имеющих пару «значение-атрибут» либо содержащих правило или набор элементов.
В общем случае для каждого из узлов значение несущего множества указывает число вариантов обучающего набора, включенных в текущий узел. Для большинства типов моделей несущее множество представляет точное число вариантов. Это значение позволяет просмотреть распределение данных по обучающим вариантам без запроса самих обучающих данных. Сервер Analysis Services также использует эти сохраненные значения для вычисления соотношения хранимых и априорных вероятностей, чтобы определить силу их влияния.
Например, в дереве классификации значение несущего множества определяет число вариантов, для которых описано сочетание атрибутов.
В дереве принятия решений сумма несущих множеств на каждом уровне дерева является суммой несущих множеств его родительского узла. Например, если модель, содержащая 1200 вариантов, делится поровну по полу, а затем делится поровну на три значения для дочерних узлов узла (2), которые являются узлами (4), (5) и (6), всегда суммируются до того же числа вариантов, что и узел (2).
Идентификатор и атрибуты узла | Число несущего множества |
---|---|
(1) Корневой узел модели | 1200 |
(2) Пол = Мужской (3) Пол = Женский |
600 600 |
(4) Пол = Мужской и Доход = Высокий (5) Пол = Мужской и Доход = Средний (6) Пол = Мужской и Доход = Низкий |
200 200 200 |
(7) Пол = Женский и Доход = Высокий (8) Пол = Женский и Доход = Средний (9) Пол = Женский и Доход = Низкий |
200 200 200 |
Для модели кластеризации число несущих множеств может быть взвешенным, включая вероятность принадлежности к нескольким кластерам. Участие в нескольких кластерах является методом кластеризации по умолчанию. Поскольку в этом случае каждый вариант не должен обязательно принадлежать одному и только одному кластеру, несущее множество для всех кластеров в этой модели может составить значение, отличное от 100%.
PROBABILITY
Указывает вероятность для определенного узла в пределах всей модели.
Как правило, вероятность представляет несущее множество для конкретного значения, поделенное на общее число вариантов в узле (NODE_SUPPORT).
Однако вероятность слегка корректируется — из нее исключается смещение, вызванное пропусками данных.
Например, если текущими значениями атрибутов [Всего детей] являются «Один» и «Два», то следует избегать создания моделей, которые прогнозируют невозможность отсутствия детей, как и наличия трех и более детей. Чтобы убедиться, что отсутствующие значения неправдоподобны, но не невозможны, алгоритм для любого атрибута всегда добавляет к числу фактических значений единицу.
Пример
Probability для [Всего детей = Один] = [Число вариантов, где Всего детей = Один] + 1/[Число всех вариантов] + 3
Probability для [Всего детей = Два] = [Число вариантов где Всего детей = Два] + 1/[Число всех вариантов] + 3
Примечание
Корректировка на 3 получается путем прибавления единицы к общему числу существующих значений n.
После корректировки вероятности для всех значений по-прежнему в сумме составляют 1. Вероятность для значения, для которого нет данных (в данном примере [Всего детей = «Ноль», «Три» или любое другое значение]), начинается на очень низком ненулевом уровне и медленно возрастает по мере добавления вариантов.
дисперсия
Показывает дисперсию значений в пределах узла. По определению дисперсия для дискретных значений всегда равна 0. Если модель поддерживает непрерывные значения, дисперсия вычисляется как σ (сигма) со знаменателем n, представляющим количество вариантов в узле.
Для представления стандартного отклонения (StDev
) существует два общих определения. В первом методе вычисления стандартного отклонения смещение учитывается, а во втором не учитывается. В общем случае в алгоритмах интеллектуального анализа данных Майкрософт при вычислении стандартного отклонения не используют смещение.
Значение, отображаемое в таблице NODE_DISTRIBUTION, является фактическим значением для всех дискретных и дискретизированных атрибутов или средним для непрерывных значений.
VALUE_TYPE
Указывает тип данных значения или атрибута и способ его использования. Определенные типы значений могут применяться только к определенным типам моделей.
VALUE_TYPE ID | Метка значения | Имя типа значения |
---|---|---|
1 | Missing | Указывает, что в данных вариантов отсутствуют значения для этого атрибута. Состояние Missing вычисляется отдельно от атрибутов, имеющих значения. |
2 | Существующий | Указывает, что данные вариантов содержат значение для этого атрибута. |
3 | С задержкой | Указывает, что значение атрибута является непрерывным числовым значением и поэтому может быть представлено средним значением вместе с дисперсией и стандартным отклонением. |
4 | Discrete | Указывает, что значение (либо числовое, либо текстовое) должно рассматриваться как дискретное. Примечание. Дискретные значения также могут отсутствовать. Эта ситуация, однако, при вычислениях обрабатывается иначе. Дополнительные сведения см. в разделе Отсутствующие значения (службы Analysis Services — интеллектуальный анализ данных). |
5 | Дискретизированный | Указывает, что атрибут содержит дискретизированные числовые значения. Это значение представляет собой строку форматирования, которая описывает сегменты дискретизации. |
6 | Существующий | Указывает, что атрибут имеет непрерывные числовые значения и что эти значения представлены в данных (нет отсутствующих или выводимых значений). |
7 | Coefficient | Указывает числовое значение, представляющее коэффициент. Коэффициент — это значение, которое применяется при вычислении значения зависимой переменной. Например, если модель создает формулу регрессии, которая прогнозирует доход на основе возраста, то в ней используется коэффициент, связывающий возраст и уровень дохода. |
8 | Score gain | Указывает числовое значение, представляющее рост оценки для атрибута. |
9 | Статистика | Указывает числовое значение, представляющее статистику для регрессора. |
10 | Node unique name | Указывает, что значение должно обрабатываться не как числовое или символьное, а как уникальный идентификатор другого узла содержимого модели. Например, в модели нейронной сети идентификаторы представляют собой указатели из узлов выходного слоя на узлы скрытого слоя, а также из узлов скрытого слоя на узлы входного слоя. |
11 | Intercept | Указывает числовое значение, представляющее отсекаемый отрезок в формуле регрессии. |
12 | Periodicity | Указывает, что значение определяет в модели периодическую структуру. Применяется только в моделях временных рядов, в которых используется алгоритм ARIMA. Примечание. Алгоритм временных рядов (Майкрософт) автоматически определяет периодические структуры на основе обучающих данных. В результате этого периодичности в конечной модели могут включать значения периодичности, которые не были заданы в качестве параметров при создании модели. |
13 | Autoregressive order | Указывает, что значение представляет число авторегрессивных рядов. Применяется в моделях временных рядов, использующих алгоритм ARIMA. |
14 | Moving average order | Представляет значение, которое представляет число скользящих средних в одном ряду. Применяется в моделях временных рядов, использующих алгоритм ARIMA. |
15 | Difference order | Указывает, что значение определяет, сколько раз был продифференцирован ряд. Применяется в моделях временных рядов, использующих алгоритм ARIMA. |
16 | Логическое | Представляет логический тип данных. |
17 | Другое | Представляет пользовательское значение, определяемое алгоритмом. |
18 | Prerendered string | Представляет пользовательское значение, которое алгоритм возвращает в виде строки. Никакое форматирование к ней объектной моделью не применяется. |
Типы значений наследуются от перечисления ADMOMD.NET. Дополнительные сведения см. в статье Microsoft.AnalysisServices.AdomdServer.MiningValueType.
Оценка узла
Значение оценки узла зависит от типа модели, а также от разных узлов. Сведения о том, каким образом вычисляется столбец NODE_SCORE для каждой модели и типа узла, см. в разделе Содержимое модели интеллектуального анализа данных по типам алгоритмов.
Вероятность узла и граничная вероятность
Набор строк схемы модели интеллектуального анализа данных включает столбцы NODE_PROBABILITY и MARGINAL_PROBABILITY для всех типов моделей. Значения в этих столбцах содержатся только для тех узлов, где значение вероятности является осмысленным. Например, корневой узел модели никогда не содержит оценки вероятности.
В узлах, содержащих оценки вероятности, вероятность узла и граничная вероятность представляют разные вычисления.
Граничная вероятность — это вероятность достижения узла из его родителя.
Вероятность узла — это вероятность достижения узла из корневого узла.
Вероятность узла всегда меньше или равна граничной вероятности.
Например, если база заказчиков в дереве принятия решений разделилась на две равные части по половому признаку (и при этом нет отсутствующих значений), то вероятность обоих дочерних узлов будет равна 0,5. Однако предположим, что каждый из узлов для пола делится поровну по уровням дохода: Высокий, Средний и Низкий. В этом случае оценка MARGINAL_PROBABILITY для каждого дочернего узла будет равна примерно 0,33, а значение NODE_PROBABILTY будет произведением всех вероятностей, ведущих к этому узлу, и поэтому будет всегда меньше значения MARGINAL_PROBABILITY.
Уровень и значение узла (атрибута) | Граничная вероятность | Вероятность узла |
---|---|---|
Корневой элемент модели Все целевые заказчики |
1 | 1 |
Целевые заказчики, разбитые по половому признаку. | .5 | .5 |
Целевые заказчики, разбитые по половому признаку, а затем по уровню дохода. | .33 | .5 * .33 = .165 |
Правило узла и граничное правило
Набор строк схемы модели интеллектуального анализа данных включает столбцы NODE_PROBABILITY и MARGINAL_PROBABILITY для всех типов моделей. В этих столбцах хранятся XML-фрагменты, которые могут быть использованы для сериализации модели или для представления некоторой части ее структуры. Эти столбцы могут оказаться пустыми для тех узлов, где они не имеют смысла.
Предусмотрено два типа XML-правил, как и для значений вероятности. XML-фрагмент в столбце MARGINAL_RULE определяет атрибут и значение текущего узла, а XML-фрагмент в столбце NODE_RULE описывает путь до текущего узла от корневого узла модели.
Содержимое модели интеллектуального анализа данных по типу алгоритма
Каждый алгоритм в пределах своей схемы содержимого хранит различные типы сведений. Например, алгоритм кластеризации Майкрософт создает много дочерних узлов, каждый из которых представляет возможный кластер. Каждый узел кластера содержит правила, описывающие характеристики, общие для всех его элементов. В отличие от этого, алгоритм линейной регрессии Майкрософт не содержит дочерних узлов; Вместо этого родительский узел модели содержит уравнение, описывающее линейную связь, обнаруженную при анализе.
В следующей таблице приведены ссылки на разделы для каждого из типов алгоритмов.
Разделы содержимого модели. Объяснение значений каждого типа узла для каждого из типов алгоритмов и советы о том, какие из узлов представляют наибольший интерес для конкретного типа модели.
Разделы запросов. Примеры запросов к модели определенного типа и рекомендации, касающиеся интерпретации результатов.
Средства просмотра содержимого модели интеллектуального анализа данных
При просмотре или изучении модели в SQL Server Data Tools (SSDT) эти сведения можно просмотреть в средстве просмотра универсального дерева содержимого (Майкрософт), доступном как в SQL Server Data Tools (SSDT), так и в SQL Server Management Studio.
Средство просмотра универсального содержимого (Майкрософт) отображает столбцы, правила, свойства, атрибуты, узлы и другое содержимое модели, используя те же сведения, которые доступны в наборе строк схемы содержимого модели интеллектуального анализа данных. Набор строк схемы содержимого представляет собой общую платформу, предназначенную для предоставления подробных сведений о содержимом модели интеллектуального анализа данных. Содержимое модели можно просмотреть в любом клиенте, поддерживающем иерархические наборы строк. Средство просмотра в SQL Server Data Tools (SSDT) представляет эти сведения в средстве просмотра таблиц HTML, которое представляет все модели в согласованном формате, что упрощает понимание структуры создаваемых моделей. Дополнительные сведения см. в разделе Просмотр модели в средстве просмотра деревьев содержимого общего вида (Майкрософт).
Средства запроса содержимого модели интеллектуального анализа данных
Чтобы получить содержимое модели интеллектуального анализа данных, необходимо создать запрос к модели интеллектуального анализа данных.
Самый простой способ создать запрос содержимого — выполнить следующую инструкцию расширений интеллектуального анализа данных в SQL Server Management Studio:
SELECT * FROM [<mining model name>].CONTENT
Дополнительные сведения см. в статье Запросы интеллектуального анализа данных.
Запрос к содержимому модели интеллектуального анализа данных можно также выполнить с помощью наборов строк схемы интеллектуального анализа данных. Такой набор строк имеет стандартную структуру, которая дает возможность клиентам анализировать, просматривать и запрашивать данные о структурах и моделях интеллектуального анализа данных. Запросы к наборам строк схемы можно выполнять с помощью инструкций XMLA, Transact-SQL и DMX.
В SQL Server 2014 вы также можете получить доступ к сведениям в наборах строк схемы интеллектуального анализа данных, открыв подключение к экземпляру служб Analysis Services и запросив системные таблицы. Дополнительные сведения см. в разделе Запрос к наборам строк схемы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
См. также:
Средство просмотра деревьев содержимого общего вида (Майкрософт) (интеллектуальный анализ данных)
Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)