Поделиться через


Хранимая процедура SystemGetClusterCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных)

Применимо к: SQL Server 2019 и более ранних версий Analysis Services Azure Analysis Services Fabric/Power BI Premium

Важно!

Интеллектуальный анализ данных не рекомендуется использовать в службах SQL Server 2017 Analysis Services, а в SQL Server 2022 Analysis Services его поддержка прекращена. Документация не обновляется для устаревших и неподдерживаемых функций. Дополнительные сведения см. в статье об обратной совместимости служб Analysis Services.

Выполняет секционирование структуры интеллектуального анализа данных на заданное количество перекрестных разделов, обучает модель по каждой секции, а затем возвращает метрики точности для каждой секции.

Примечание . Эта хранимая процедура может использоваться только со структурой интеллектуального анализа, содержащей по крайней мере одну модель кластеризации. Для перекрестной проверки моделей, не являющихся кластеризация, необходимо использовать SystemGetCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных).

Синтаксис

  
SystemGetClusterCrossValidationResults(  
<structure name>,   
[,<mining model list>]  
,<fold count>}  
,<max cases>  
<test list>])  

Аргументы

Структура интеллектуального анализа данных
Имя структуры интеллектуального анализа данных в текущей базе данных.

(обязательно)

список моделей интеллектуального анализа данных
Список моделей интеллектуального анализа данных для проверки с разделителями-запятыми.

Если не указан список моделей интеллектуального анализа, перекрестная проверка выполняется в отношении всех моделей кластеризации, связанных с заданной структурой интеллектуального анализа.

Примечание

Для перекрестной проверки моделей, не кластеризация, необходимо использовать отдельную хранимую процедуру SystemGetCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных).

(необязательно).

количество сверток
Целое число, указывающее количество секций, на которое разделяется набор данных. Минимальное значение — 2. Максимальное число сверток равно минимальному из следующих двух значений — maximum integer и количество вариантов.

Каждая секция будет содержать примерно такое количество вариантов: максимальноечисло свертокслучаев/.

Значение по умолчанию отсутствует.

Примечание

Количество сверток оказывает существенное влияние на время, необходимое для перекрестной проверки. Если выбрать слишком большое количество сверток, запрос может выполняться очень долго, а в некоторых случаях сервер может стать недоступным или превысить лимит времени ожидания.

(обязательно)

максимальное число случаев
Целое число, определяющее максимальное количество вариантов, которые можно проверять.

Значение 0 показывает, что будут использоваться все варианты в источнике данных.

Если указано число, превышающее фактическое количество вариантов в наборе данных, будут использоваться все варианты в источнике данных.

(обязательно)

список тестирования
Строка, указывающая параметры тестирования.

Примечание. Этот параметр зарезервирован для использования в будущем.

(необязательно).

Тип возвращаемых данных

Таблица возвращаемых типов содержит оценки каждой отдельной секции и статистических функций для всех моделей.

В следующей таблице приводятся описания возвращаемых столбцов.

Имя столбца Описание
ModelName Имя протестированной модели.
AttributeName Имя прогнозируемого столбца. Для кластерных моделей всегда имеет значение null.
AttributeState Заданное целевое значение в прогнозируемом столбце. Для моделей кластера всегда имеет значение NULL.
PartitionIndex Начинающийся с 1 индекс, определяющий, к какой секции применяются результаты.
PartitionSize Целое число, показывающее, сколько вариантов было включено в каждую секцию.
Тест Тип выполненного теста.
Мера Имя меры, возвращенной тестом. Меры для каждой модели зависят от типа прогнозируемого значения. Определение каждой меры см. в разделе Перекрестная проверка (службы Analysis Services — интеллектуальный анализ данных).

Список мер, возвращаемых для каждого прогнозируемого типа, см. в разделе Меры в отчете перекрестной проверки.
Значение Значение указанной проверочной меры.

Комментарии

Чтобы вернуть метрики точности для всего набора данных, используйте SystemGetClusterAccuracyResults (службы Analysis Services — интеллектуальный анализ данных).

Кроме того, если модель интеллектуального анализа данных уже разбита на свертки, можно обойти обработку и вернуть только результаты перекрестной проверки с помощью SystemGetClusterAccuracyResults (службы Analysis Services — интеллектуальный анализ данных).

Примеры

В следующем примере показано, как секционировать структуру интеллектуального анализа на три свертки, и далее проводится проверка двух моделей кластеризации, связанных с этой структурой интеллектуального анализа.

В третьей строке кода приведен список моделей интеллектуального анализа, предназначенных для проверки. Если не задать список, будут использоваться все модели кластеризации, связанные с этой структурой.

В четвертой строке кода задано количество сверток, а на пятой – максимальное число вариантов.

Поскольку это модели кластеризации, не обязательно указывать прогнозируемый атрибут или значение.

CALL SystemGetClusterCrossValidationResults(  
[v Target Mail],  
[Cluster 1], [Cluster 2],  
3,  
10000  
)  

Образец результатов.

ModelName AttributeName AttributeState PartitionIndex PartitionSize Тест Мера Значение
Кластер 1 1 3025 Кластеризация Вероятность варианта 0.930524511864121
Кластер 1 2 3025 Кластеризация Вероятность варианта 0.919184178430778
Кластер 1 3 3024 Кластеризация Вероятность варианта 0.929651120490248
Кластер 2 1 1289 Кластеризация Вероятность варианта 0.922789726933607
Кластер 2 2 1288 Кластеризация Вероятность варианта 0.934865535691068
Кластер 2 3 1288 Кластеризация Вероятность варианта 0.924724595688798

Требования

Перекрестная проверка доступна только в SQL Server Enterprise начиная с SQL Server 2008 года.

См. также:

SystemGetCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных)
SystemGetAccuracyResults (службы Analysis Services — интеллектуальный анализ данных)
SystemGetClusterCrossValidationResults
Метод SystemGetClusterAccuracyResults (службы Analysis Services — интеллектуальный анализ данных)