Поделиться через


Меры в отчете перекрестной проверки

Применимо к: SQL Server 2019 и более ранних версий Analysis Services Azure Analysis Services Fabric/Power BI Premium

Важно!

Интеллектуальный анализ данных не рекомендуется использовать в службах SQL Server 2017 Analysis Services, а в SQL Server 2022 Analysis Services его поддержка прекращена. Документация не обновляется для устаревших и неподдерживаемых функций. Дополнительные сведения см. в статье об обратной совместимости служб Analysis Services.

Во время перекрестной проверки SQL Server Analysis Services разделяет данные в структуре интеллектуального анализа данных на несколько разделов, а затем итеративно тестирует структуру и все связанные с ней модели интеллектуального анализа данных. На основании такого анализа для структуры и каждой модели выводится набор стандартных точных мер.

Отчет содержит общие сведения о количестве сверток в данных, сумму данных в каждой свертке и набор общих показателей, описывающих распределение данных. Сравнивая общие показатели, созданные для каждого разреза, можно оценить надежность структуры или модели.

SQL Server Analysis Services также отображает набор подробных мер для моделей интеллектуального анализа данных. Такие меры зависят от типа модели и типа анализируемого атрибута, например дискретный или непрерывный.

В данном разделе предоставляется список мер, которые содержатся в отчете Перекрестная проверка , и разъяснения к ним. Дополнительные сведения о том, как вычисляется каждая мера, см. в разделе Формулы перекрестной проверки.

Перечень мер в отчете перекрестной проверки

В следующей таблице перечислены меры, используемые в отчете перекрестной проверки. Меры группируются с помощью типа проверки, который находится в левой столбце следующей таблицы. В правом столбце перечислены наименования мер в порядке, в котором они появляются в отчете, и краткое разъяснение к ним.

типа проверки Меры и описания
Кластеризация Меры, применяемые к моделям кластеризации
Вероятность регистра:
Эта мера обычно указывает на вероятность принадлежности варианта определенному кластеру. Для перекрестной проверки оценки суммируются и затем делятся на количество вариантов, таким образом получается среднее правдоподобие кластерного варианта.
Классификация Меры, применяемые к моделям классификации
Истинно положительный результат/Истинный отрицательный/Ложноположительный результат/Ложноотрицательный результат:

Число строк или значений в секции, в которой прогнозируемое состояние совпадает с целевым, а прогнозируемая вероятность выше указанного порога состояния.

Варианты, в которых отсутствуют значения для целевого атрибута, не учитываются, то есть могут учитываться не все значения.
Передача или сбой:
Число строк или значений в секции, в которой прогнозируемое состояние совпадает с целевым, а прогнозируемая вероятность больше 0.
Вероятность Меры правдоподобия применяются к нескольким типов моделей.
Лифт:
Отношение фактической вероятности прогноза к граничной вероятности в проверочных вариантах. Исключаются строки с отсутствующими значениями целевого атрибута.

Данная мера обычно показывает степень улучшения вероятности конечного результата при использовании модели.
Корневая среднеквадратическая погрешность:
Отношение квадратного корня из средней погрешности для всех вариантов в секции к количеству вариантов, за исключением строк, в которых нет значения для целевого атрибута.

Корень среднеквадратичной погрешности является общепринятой оценкой для моделей прогнозирования. Оценка усредняет остатки для каждого варианта, чтобы выработать единственный индикатор погрешности модели.
Оценка журнала:
Сумма логарифмов действительной вероятности для каждого случая, деленная на число строк во входном наборе данных, за исключением строк, в которых нет значения для целевого атрибута.

Поскольку вероятность выражается десятичной дробью, логарифмическая оценка всегда отрицательные. Чем ближе число к 0, тем выше оценка. Тогда как необработанные оценки могут содержать очень нерегулярные и асимметричные распределения, логарифмическая оценка подобна процентной доле.
Оценка Меры, которые применяются только к моделям оценки, прогнозирующим непрерывный числовой атрибут.
Корневая среднеквадратическая погрешность:
Средняя погрешность при сравнении спрогнозированного значения с фактическим.

Корень среднеквадратичной погрешности является общепринятой оценкой для моделей прогнозирования. Оценка усредняет остатки для каждого варианта, чтобы выработать единственный индикатор погрешности модели.
Средняя абсолютная ошибка:
Средняя погрешность при сравнении спрогнозированного значения с фактическим, рассчитываемая как абсолютная сумма погрешностей.

Средняя абсолютная погрешность помогает понять, насколько сделанные прогнозы приближены к настоящим значениям. Меньшая оценка означает, что прогнозы были более точными.
Оценка журнала.
Сумма логарифмов действительной вероятности для каждого случая, деленная на число строк во входном наборе данных, за исключением строк, в которых нет значения для целевого атрибута.

Поскольку вероятность выражается десятичной дробью, логарифмическая оценка всегда отрицательные. Чем ближе число к 0, тем выше оценка. Тогда как необработанные оценки могут содержать очень нерегулярные и асимметричные распределения, логарифмическая оценка подобна процентной доле.
Статистические выражения Агрегатные меры отображают дисперсию в результатах по каждой секции.
Среднее значение:
Средние значения секций по конкретным мерам.
Стандартное отклонение:
Среднее отклонение от среднего арифметического для конкретной меры, с учетом всех секций модели.

Для перекрестной проверки более высокое значение этой оценки предполагает существенные различия между свертками.

См. также:

Тестирование и проверка (интеллектуальный анализ данных)