Создание проверочного набора (Мастер интеллектуального анализа данных)
На странице Создание проверочного набора указывается, какая часть данных должна использоваться для обучения, а какая должна быть зарезервирована для применения в качестве проверочного набора. Благодаря разделению данных на обучающий и проверочный наборы при создании структуры интеллектуального анализа становится намного проще оценить точность моделей интеллектуального анализа данных, создаваемых в дальнейшем.
Можно указать количество проверочных данных в процентах или задать число, чтобы ограничить количество вариантов, используемых для проверки. Если указаны и процентная доля, и максимальное количество вариантов, используемых для проверки, то сравниваются оба параметра и в набор проверочных данных включается меньшее из двух значений количества вариантов. По умолчанию используется 30 процентов данных для проверки, 70 процентов — для обучения, и максимальное количество проверочных вариантов не устанавливается.
По умолчанию службы Analysis Services создают числовое начальное значение, используемое для начала секционирования. Это начальное значение определяется на основе имени структуры интеллектуального анализа данных. Если необходимо, чтобы секции оставались неизменными даже при изменении имени структуры интеллектуального анализа, можно указать величину начального значения, указав свойство HoldoutSeed структуры интеллектуального анализа данных. Если это начальное контрольное значение изменится, обработка структуры должна быть выполнена повторно.
Если позже вы хотите изменить объем тестов или обучающих данных, можно изменить HoldoutMaxCases
и HoldoutMaxPercent
свойства структуры интеллектуального анализа данных с помощью окна "Свойства ". Однако после такого изменения необходимо выполнить повторную обработку структуры интеллектуального анализа и всех связанных с ней моделей интеллектуального анализа данных. Также действуют следующие ограничения.
Секционирование структуры интеллектуального анализа данных поддерживается только в том случае, если структура интеллектуального анализа данных хранится в SQL Server 2008. Более ранние версии служб SQL Server Analysis Services не поддерживают кэширование сведений о секциях для структур интеллектуального анализа данных.
Секционирование структуры интеллектуального анализа данных невозможно, если структура интеллектуального анализа содержит ключевой столбец времени, который требуется для моделей интеллектуального анализа данных с временными рядами.
Секционировать данные невозможно, если предпринимается попытка прогнозирования значения, которое хранится во вложенной таблице.
Дополнительные сведения: тестирование и проверка (интеллектуальный анализ данных), создание реляционной структуры интеллектуального анализа данных, учебник по базовому интеллектуальному анализу данных
Параметры
Процент данных для тестирования
Нажимайте кнопки со стрелками вверх и вниз, чтобы увеличить или уменьшить процентную долю данных, предназначенных для использования в качестве обучающего множества, или введите значение от 0 до 100 в текстовом поле.
Максимальное число случаев тестирования набора данных
Введите число, ограничивающее количество вариантов, которые могут использоваться для проверки.
Если указано число, превышающее фактическое количество вариантов в данных, будут использоваться все варианты.
По умолчанию имеет значение NULL. Это означает отсутствие какого-либо предела.
См. также
Справка мастера интеллектуального анализа данных F1 (службы Analysis Services — интеллектуальный анализ данных)
Предложение связанных столбцов (мастер интеллектуального анализа данных)
Определение типов таблиц (мастер интеллектуального анализа данных)
Определение содержимого и типа данных столбца (мастер интеллектуального анализа данных)