Сравнение прогнозов моделей прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)
В предыдущих шагах этого учебника было создано несколько моделей временных рядов:
прогнозы для каждого сочетания региона и модели, основанные только на данных по конкретной модели и региону;
прогнозы для каждого региона на основе обновленных данных.
глобальные прогнозы для всех моделей, основанные на статистических данных;
прогнозы для модели M200 в Североамериканском регионе, основанные на статической модели.
Чтобы резюмировать функции для прогнозов временных рядов, будут рассмотрены изменения, показывающие, как параметры расширения или замены данных повлияли на результаты прогнозов.
Сравнение исходных результатов с результатами после добавления данных
Давайте рассмотрим данные только для линейки продуктов M200 в Тихоокеанском регионе, чтобы увидеть, как обновление модели с новыми данными влияет на результаты. Помните, что ряд исходных данных закончился в июне 2004 г., а новые данные были получены за июль, август и сентябрь.
Первый столбец содержит новые добавленные данные.
Второй столбец содержит прогноз на июль и далее на основе рядов исходных данных.
Третий столбец содержит прогноз на основе расширенных данных.
M200 Pacific | Обновленные данные по фактическим продажам | Прогноз до добавления данных | Расширенный прогноз |
---|---|---|---|
7-25-2008 | 65 | 32 | 65 |
8-25-2008 | 54 | 37 | 54 |
9-25-2008 | 61 | 32 | 61 |
10-25-2008 | Нет данных | 36 | 32 |
11-25-2008 | Нет данных | 31 | 41 |
12-25-2008 | Нет данных | 34 | 32 |
Обратите внимание, что прогноз с использованием расширенных данных (показаны полужирным шрифтом) в точности повторяет точки фактических данных. Это намеренное повторение. Если есть точки фактических данных, прогнозирующий запрос возвращает фактические значения, а новые значения прогноза появляются только после того, как точки фактических данных закончились.
В целом, этот алгоритм взвешивает изменения в новых данных более основательно, чем данные в начале модели. Однако в данном случае новые цифры по продажам представляют собой прирост 20–30 % относительно предыдущего периода, поэтому это привело лишь к незначительному повышению запланированных продаж, после чего линия прогнозируемого тренда снова уходит вниз, что соответствует тренду по месяцам до получения новых данных.
Сравнение исходных результатов с результатами перекрестного прогнозирования
Следует помнить, что исходная модель интеллектуального анализа данных показала значительные отличия между регионами и линейками продукции. Например, был показан очень сильный тренд продаж для модели M200, тогда как продажи модели T1000 были относительно низки для всех регионов. Кроме того, некоторые серии не имеют большого объема данных. Серии были неорванными, а это означает, что они не имеют той же отправной точки.
Каким же образом изменились прогнозы после того, как они были основаны на общей модели, которая основывалась на продажах во всем мире, а не на исходных наборах данных? Чтобы убедиться, что не были потеряны какие-либо данные и что прогнозы являются точными, можно сохранить результаты в таблицу, присоединить таблицу прогнозов к таблице исторических данных, а затем создать график двух наборов исторических данных и прогнозов.
Следующая диаграмма основывается на одной линейке продукции M200. График сравнивает прогноз исходной модели интеллектуального анализа данных с прогнозом с помощью агрегированной модели интеллектуального анализа данных.
Из этой диаграммы можно сделать вывод, что агрегированная модель интеллектуального анализа данных сохраняет общий диапазон и тренды в значениях, сглаживая при этом колебания отдельных рядов данных.
Заключение
Было изучено создание и настройка модели временных рядов, которая может быть использована для прогнозирования.
Было изучено обновление моделей временных рядов без их повторной обработки, путем добавления новых данных и создания прогнозов с помощью параметра EXTEND_MODEL_CASES.
Было изучено создание моделей, которые можно использовать для перекрестного прогнозирования, используя параметр REPLACE_MODEL_CASES и применяя модель к другому ряду данных.
См. также:
Учебник по интеллектуальному анализу данных — средний уровень (службы Analysis Services — интеллектуальный анализ данных)
Примеры запросов моделей временных рядов