создать отчет перекрестной проверки
Применимо к: SQL Server 2019 и более ранних версий Analysis Services Azure Analysis Services Fabric/Power BI Premium
Важно!
Интеллектуальный анализ данных не рекомендуется использовать в службах SQL Server 2017 Analysis Services, а в SQL Server 2022 Analysis Services его поддержка прекращена. Документация не обновляется для устаревших и неподдерживаемых функций. Дополнительные сведения см. в статье об обратной совместимости служб Analysis Services.
В данном разделе описывается создание отчета перекрестной проверки с помощью вкладки «Диаграмма точности» в конструкторе интеллектуального анализа данных. Общие сведения о том, как выглядит отчет о перекрестной проверке и статистических мерах, которые он включает, см. в разделе Перекрестная проверка (службы Analysis Services — интеллектуальный анализ данных).
Отчет перекрестной проверки существенно отличается от диаграммы точности, в том числе от диаграммы точности прогнозов или матрицы классификации.
Перекрестная проверка оценивает общее распределение данных, используемых в модели или структуре. Таким образом, пользователь не указывает тестируемый набор данных. При перекрестной проверке всегда задействованы только исходные данные, использованные для обучения модели или структуры интеллектуального анализа данных.
Перекрестная проверка может выполняться только в отношении одного прогнозируемого результата. Если структура поддерживает модели, имеющие разные прогнозируемые атрибуты, необходимо создать отдельные отчеты для каждого прогнозируемого результата.
Для перекрестной проверки доступны только те модели, которые связаны со структурой, выбранной в данный момент.
Если выбранная в данный момент структура поддерживает сочетание кластеризованных и некластеризованных моделей, то при нажатии кнопки Получить результатыхранимая процедура перекрестной проверки автоматически загрузит модели, имеющие одинаковый прогнозируемый столбец, и проигнорирует кластеризованные модели, у которых нет одинакового прогнозируемого атрибута.
Отчет перекрестной проверки для кластеризованной модели, не имеющей предсказуемого атрибута, можно создать, только если структура интеллектуального анализа данных не поддерживает другие прогнозируемые атрибуты.
Выбор структуры интеллектуального анализа данных
Откройте Designer интеллектуального анализа данных в SQL Server Data Tools.
В обозревателе решений откройте базу данных, содержащую структуру или модель, для которой создается отчет.
Дважды щелкните по структуре интеллектуального анализа данных, чтобы открыть структуру и связанные с ней модели в конструкторе интеллектуального анализа данных.
Перейдите на вкладку Диаграмма точности интеллектуального анализа .
Перейдите на вкладку Перекрестная проверка .
Установка параметров перекрестной проверки
На вкладке Перекрестная проверка щелкните стрелку вниз в поле Количество свертоки выберите число от 1 до 10. Значение по умолчанию — 10.
Значение Количество сверток представляет число секций, которое будет создано в оригинальном наборе данных. Если установить в поле «Количество сверток» значение 1, обучающий набор будет использован без секционирования.
Щелкните стрелку вниз поля Целевой атрибути выберите из списка столбец. При работе с моделью кластеризации выберите значение #Cluster , чтобы указать, что модель не имеет прогнозируемого атрибута. Обратите внимание, что значение #Clusterдоступно, только когда структура интеллектуального анализа данных не поддерживает другие типы прогнозируемых атрибутов.
Для каждого отчета можно выбрать только один прогнозируемый атрибут. По умолчанию в отчет включаются все связанные модели, имеющие один и тот же прогнозируемый атрибут.
В поле Максимальное число вариантоввведите число, достаточное для обеспечения репрезентативной выборки данных при их разбиении между указанным числом сверток. Если это число больше числа вариантов в обучающем наборе модели, будут использованы все варианты.
При большом размере набора данных для обучения установка значения Максимальное число вариантов ограничивает общее число обработанных вариантов и позволяет ускорить обработку отчета. Однако не следует занижать значение Максимальное число вариантов , поскольку это может привести к недостатку данных для перекрестной проверки.
Дополнительно можно ввести в поле Целевое состояниезначение прогнозируемого атрибута, который следует моделировать. Например, если у столбца «Покупатель велосипеда» есть два возможных значения, 1 (Да) и 2 (Нет), то можно ввести значение 1 для оценки точности модели для получения только нужного результата.
Примечание
Если значение не было введено, то параметр Целевой порог будет недоступен, а оценка модели будет проведена по всем возможным значениям прогнозируемого атрибута.
Дополнительно можно ввести в поле Целевой порогдесятичную дробь от 0 до 1, чтобы указать минимальную вероятность, при которой прогноз может считаться точным.
Дополнительные советы по установке порогов вероятности см. в разделе Меры в отчете перекрестной проверки.
Щелкните Получить результаты.
Печать отчета перекрестной проверки
Щелкните правой кнопкой мыши готовый отчет на вкладке Перекрестная проверка .
В контекстном меню выберите пункт Печать или Предварительный просмотр печати , чтобы выполнить предварительный просмотр отчета.
Создание копии отчета в Microsoft Excel
Щелкните правой кнопкой мыши готовый отчет на вкладке Перекрестная проверка .
В контекстном меню выберите команду Выделить все.
Щелкните правой кнопкой мыши выделенный текст и выберите пункт Копировать.
Вставьте выбранный текст в открытую книгу Excel. Если использовалась команда Вставить , отчет будет вставлен в Excel как HTML; это сохранит форматирование строк и столбцов. Если для вставки отчета использовалась команда Специальная вставка для текста или текста в формате Юникод, отчет будет вставлен в формате с разделителями строк.