Проверка точности при помощи диаграмм точности прогнозов (учебник интеллектуального анализа данных, начальный уровень)
На вкладке Диаграмма точности интеллектуального анализа данных конструктора интеллектуального анализа данных можно вычислить, насколько точны прогнозы каждой из моделей, а также сравнить результаты каждой модели по отношению к другим моделям. Этот метод сравнения имеет название Диаграмма точности прогнозов. Обычно точность прогнозирования модели интеллектуального анализа данных определяется либо точностью предсказания, либо точностью классификации. В данном учебнике используются только диаграммы точности прогнозов. Дополнительные сведения о диаграммах точности прогнозов и других типах диаграмм точности см. в разделе Средства проверки точности построения моделей (службы Analysis Services — интеллектуальный анализ данных).
В этом разделе будут выполнены следующие задачи:
Выбор входных данных
Выбор моделей, прогнозируемых столбцов и значений
Выбор входных данных
Первым шагом в проверке точности моделей интеллектуального анализа данных является выбор источника данных, который будет использоваться для проверки. Будет проверено, насколько хорошо работают модели на проверочных данных, а затем эти модели будут использованы с внешними данными.
Выбор набора данных
На вкладке Диаграмма точности интеллектуального анализа конструктора интеллектуального анализа данных в среде Business Intelligence Development Studio перейдите на вкладку Выбор входа.
В окне группы Выбор набора данных для диаграммы точности выберите Использовать проверочные варианты структуры интеллектуального анализа, чтобы проверить модели, используя проверочные данные которые резервировались при создании структуры интеллектуального анализа данных.
Дополнительные сведения о других параметрах см. в разделе Измерение точности модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
Выбор моделей, прогнозируемых столбцов и значений
Теперь следует выбрать модели, которые будут включены в диаграмму точности прогнозов, а также выбрать прогнозируемый столбец, с которым будут сравниваться эти модели, и значение для прогнозирования.
Примечание |
---|
Столбцы модели интеллектуального анализа данных, которые перечислены в списке Имя прогнозируемого столбца, ограничены столбцами, имеющими тип применения Predict или Predict Only, и имеют тип содержимого Discrete или Discretized. |
Отображение расхождения моделей
На вкладке Выбор входа конструктора интеллектуального анализа данных в группе Выбрать прогнозируемые столбцы модели интеллектуального анализа данных для отображения на диаграмме точности прогнозов установите флажок Синхронизировать столбцы и значения прогноза.
Убедитесь, что в столбце Имя прогнозируемого столбца для каждой модели выбрано Покупатель велосипеда.
В столбце Показать выберите все модели.
По умолчанию выбраны все модели в структуре интеллектуального анализа данных. Можно выбрать любую из моделей, однако в данном учебнике следует оставить выбранными все модели.
В столбце Прогнозируемое значение выберите 1. То же значение автоматически вводится для каждой модели, имеющей такой же прогнозируемый столбец.
Затем перейдите на вкладку Диаграмма точности прогнозов для просмотра готовой диаграммы.
При переходе на эту вкладку будет выполнен прогнозирующий запрос к серверу и базе данных для структуры интеллектуального анализа данных и входной таблицы или проверочного набора данных. Результаты выводятся в виде диаграммы.
При вводе Прогнозируемого значения в диаграмме точности прогнозов выводятся результаты для модели случайного выбора и для идеальной модели. В реальности модель интеллектуального анализа данных находится, скорее всего, между этими крайними случаями: случайным предположением и идеальным прогнозом. Любое повышение по сравнению со случайным предположением считается повышением точности прогнозирования.
Для нахождения линий, представляющих идеальную модель и модель случайного выбора, используйте условные обозначения.
Обратите внимание, что модель TM_Decision_Tree обеспечивает самое большое повышение точности прогнозирования, больше, чем в модели алгоритма кластеризации и в модели упрощенного алгоритма Байеса.
Более подробное описание диаграммы точности прогнозов, подобной приведенной на этом занятии, см. в разделе Диаграмма точности прогнозов (службы Analysis Services — интеллектуальный анализ данных).
Следующая задача занятия
Проверка модели с фильтром (учебник по интеллектуальному анализу данных — начальный уровень)