Настройка и обработка модели прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)
Алгоритм временных рядов (Майкрософт) предоставляет параметры, влияющие на создание модели и анализ данных времени. С помощью этих свойств можно существенно повлиять на прогнозы, сделанные моделью интеллектуального анализа данных.
На этом занятии учебника вы выполните следующие изменения модели.
Вы настроите способ обработки периодов времени в модели, добавив новое значение для параметра PERIODICITY_HINT .
Вы узнаете о двух других важных параметрах для алгоритма временных рядов Майкрософт: FORECAST_METHOD, который позволяет управлять методом прогнозирования, и PREDICTION_SMOOTHING, который позволяет настраивать сочетание долгосрочных и краткосрочных прогнозов.
При необходимости можно указать алгоритму, как вычислять отсутствующие значения.
После внесения всех изменений необходимо будет развернуть и обработать модель.
Настройка параметров временных рядов
Указания периодичности
Параметр PERIODICITY_HINT предоставляет алгоритму сведения о дополнительных периодах времени, которые должны отображаться в данных. По умолчанию модели временных рядов автоматически пытаются обнаружить закономерность в данных. Но если ожидаемый временной цикл уже известен, указание периодичности может повысить точность модели. Однако неправильное указание периодичности может снизить точность, поэтому если вы не уверены, какое значение использовать, лучше оставить значение по умолчанию.
Например, представление, используемое для этой модели, ежемесячно объединяет данные о продажах из Adventure Works DW Multidimensional 2012. Поэтому каждый временной срез, используемый моделью, представляет один месяц, и все прогнозы также делаются по месяцам. Так как в году есть 12 месяцев, и вы ожидаете, что шаблоны продаж более или менее повторяются ежегодно, вы присвойте параметру12
PERIODICITY_HINT значение , чтобы указать, что 12 временных срезов (месяцев) составляют один полный цикл продаж.
Метод прогнозирования
Параметр FORECAST_METHOD определяет, оптимизирован ли алгоритм временных рядов для краткосрочных или долгосрочных прогнозов. По умолчанию параметр FORECAST_METHOD имеет значение MIXED, что означает, что два разных алгоритма смешиваются и сбалансированы, чтобы обеспечить хорошие результаты как для краткосрочного, так и для долгосрочного прогнозирования.
Однако если вы хотите использовать определенный алгоритм, можно изменить это значение на ARIMA или ARTXP.
Весовые Long-Term и прогнозы Short-Term
Можно также настроить сочетание долгосрочных и краткосрочных прогнозов с помощью параметра PREDICTION_SMOOTHING. По умолчанию он имеет параметр 0,5, что обычно обеспечивает наилучший баланс для общей точности.
Изменение параметров алгоритма
На вкладке Модели интеллектуального анализа данных щелкните правой кнопкой мыши элемент Прогнозирование и выберите Задать параметры алгоритма.
В строке
PERIODICITY_HINT
диалогового окна Параметры алгоритма щелкните столбец Значение и введите{12}
, включая фигурные скобки.По умолчанию алгоритм также добавит значение {1}.
FORECAST_METHOD
Убедитесь, что текстовое поле Значение в строке пустое или имеет значениеMIXED
. Если введено другое значение, введитеMIXED
, чтобы вернуть параметр на значение по умолчанию.Убедитесь, что в строке PREDICTION_SMOOTHING текстовое поле Значение пусто или задано значение 0,5. Если введено другое значение, щелкните Значение и введите
0.5
, чтобы вернуть параметр на значение по умолчанию.Примечание
Параметр PREDICTION_SMOOTHING доступен только в SQL Server Enterprise. Поэтому в SQL Server Standard нельзя просмотреть или изменить значение параметра PREDICTION_SMOOTHING. Однако по умолчанию используются оба алгоритма с одинаковым весом.
Нажмите кнопку ОК.
Обработка отсутствующих данных (необязательно)
Во многих случаях данные продаж могут иметь пробелы, заполненные нулями, или магазин может не выполнить отчет к сроку, в результате чего в конце ряда останется пустая ячейка. В таких сценариях службы Analysis Services вызывают следующую ошибку и не обрабатывают модель.
"Ошибка (интеллектуальный анализ данных): метки времени не синхронизированы, начиная с <имени> ряда, модели интеллектуального анализа данных, <имени> модели. Все временные ряды должны завершаться в одной временной метке и не могут иметь произвольно отсутствующие точки данных. Задание в качестве значения параметра MISSING_VALUE_SUBSTITUTION "PREVIOUS" или числовой константы автоматически исправляет отсутствующие точки данных, где это возможно».
Чтобы избежать этой ошибки, можно указать, что службы Analysis Services автоматически предоставляют новые значения для заполнения пробелов, используя любой из следующих методов:
Использование среднего значения. Среднее значение вычисляется с помощью всех действительных значений в одном ряде данных.
Использование предыдущего значения. Несколько ячеек с отсутствующими данными можно заполнить предыдущими значениями, но нельзя заполнить начальные значения.
Использование предоставляемого постоянного значения.
Заполнение промежутков средними значениями
На вкладке Модели интеллектуального анализа данных щелкните правой кнопкой мыши столбец Прогнозирование и выберите Задать параметры алгоритма.
В диалоговом окне Параметры алгоритма в строке MISSING_VALUE_SUBSTITUTION щелкните столбец Значение и введите
Mean
.
Построение модели
Чтобы использовать модель, необходимо развернуть ее на сервере и обработать, выполнив алгоритм с обучающими данными.
Обработка модели прогнозирования
В меню Модель интеллектуального анализа данных SQL Server Data Tools выберите Обработать структуру интеллектуального анализа данных и все модели.
В предупреждении с вопросом о том, нужно ли выполнить сборку и развертывание проекта, нажмите кнопку Да.
В диалоговом окне Обработка структуры интеллектуального анализа данных — прогнозирование нажмите кнопку Выполнить.
Будет открыто диалоговое окно Ход обработки , в котором отображаются сведения о ходе обработки модели. Обработка модели может занять некоторое время.
После успешного завершения обработки нажмите кнопку Закрыть , чтобы закрыть диалоговое окно Ход обработки .
Нажмите кнопку Закрыть еще раз, чтобы выйти из диалогового окна Структура интеллектуального анализа данных процесса — прогнозирование .
Следующая задача занятия
Изучение модели прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)
См. также:
Microsoft Time Series Algorithm Technical Reference
Алгоритм временных рядов (Майкрософт)
Требования к обработке и связанные замечания (интеллектуальный анализ данных)