Personalizar y procesar el modelo de pronóstico (tutorial intermedio de minería de datos)
El algoritmo de serie temporal de Microsoft proporciona parámetros que afectan a cómo se crea un modelo y cómo se analizan los datos de tiempo. Cambiar estas propiedades puede afectar de forma significativa a la manera en que el modelo de minería de datos realiza las predicciones.
Para esta tarea del tutorial, modificará el modelo mediante las tareas siguientes:
Personalizará la forma en que el modelo controla los períodos de tiempo agregando un nuevo valor para el parámetro PERIODICITY_HINT .
Aprenderá otros dos parámetros importantes para el algoritmo de serie temporal de Microsoft: FORECAST_METHOD, que le permite controlar el método usado para la predicción, y PREDICTION_SMOOTHING, que permite personalizar la combinación de predicciones a largo plazo y a corto plazo.
Opcionalmente, indicará al algoritmo cómo desea que se imputen los valores ausentes.
Una vez realizados todos los cambios, implementará y procesará el modelo.
Establecer los parámetros de serie temporal
Sugerencias de periodicidad
El parámetro PERIODICITY_HINT proporciona al algoritmo información sobre períodos de tiempo adicionales que espera ver en los datos. De forma predeterminada, los modelos de serie temporal intentarán detectar automáticamente un patrón en los datos. Sin embargo, si ya conoce el período de tiempo esperado, proporcionar una sugerencia de periodicidad podría mejorar la exactitud del modelo. Sin embargo, si proporciona una sugerencia de periodicidad errónea, puede reducir la exactitud; por consiguiente, si no está seguro del valor que debe utilizarse, es mejor usar el valor predeterminado.
Por ejemplo, la vista usada para este modelo agrega datos de ventas de Adventure Works DW Multidimensional 2012 mensualmente. Por consiguiente, cada segmento de tiempo utilizado en el modelo representa un mes y todas las predicciones también estarán en términos de meses. Dado que hay 12 meses en un año y espera que los patrones de ventas se repitan más o menos cada año, establecerá el parámetro 12
PERIODICITY_HINT en , para indicar que 12 segmentos de tiempo (meses) constituyen un ciclo de ventas completo.
Método de pronóstico
El parámetro FORECAST_METHOD controla si el algoritmo de serie temporal está optimizado para predicciones a corto o largo plazo. De forma predeterminada, el parámetro FORECAST_METHOD se establece en MIXED, lo que significa que dos algoritmos diferentes se combinan y equilibran para proporcionar buenos resultados para la predicción a corto y largo plazo.
No obstante, si sabe que debe usar un algoritmo concreto, puede cambiar el valor a ARIMA o ARTXP.
Ponderación de Long-Term frente a predicciones de Short-Term
También puede personalizar el modo en que las predicciones a largo plazo y a corto plazo se combinan mediante el parámetro PREDICTION_SMOOTHING. De forma predeterminada, este parámetro está establecido en 0,5, lo que generalmente proporciona el mayor equilibrio para conseguir la máxima precisión.
Para cambiar los parámetros del algoritmo
En la pestaña Modelos de minería de datos, haga clic con el botón derecho en Previsión y seleccione Establecer parámetros de algoritmo.
En la
PERIODICITY_HINT
fila del cuadro de diálogo Parámetros de algoritmo , haga clic en la columna Valor y escriba{12}
, incluidas las llaves.De forma predeterminada, el algoritmo también agregará el valor {1}.
En la
FORECAST_METHOD
fila, compruebe que el cuadro de texto Valor está en blanco o establecido enMIXED
. Si se ha especificado un valor diferente, escribaMIXED
para cambiar el parámetro de nuevo al valor predeterminado.En la fila PREDICTION_SMOOTHING , compruebe que el cuadro de texto Valor está en blanco o establecido en 0,5. Si se ha especificado un valor diferente, haga clic en Valor y escriba
0.5
para volver a cambiar el parámetro al valor predeterminado.Nota:
El parámetro PREDICTION_SMOOTHING solo está disponible en SQL Server Enterprise. Por lo tanto, no puede ver ni cambiar el valor del parámetro PREDICTION_SMOOTHING en SQL Server Standard. Sin embargo, el comportamiento predeterminado es utilizar los dos algoritmos y ponderarlos de forma equitativa.
Haga clic en OK.
Manejar la ausencia de datos (opcional)
En muchos casos, los datos de ventas podrían tener huecos que se rellenan con caracteres nulos, o es posible que un almacén no haya podido cumplir la fecha tope de notificación, con lo que se ha dejado una celda vacía al final de la serie. En estos escenarios, Analysis Services genera el siguiente error y no procesará el modelo.
"Error (minería de datos): marcas de tiempo no sincronizadas a partir del nombre> de la serie de series<, del modelo de minería de datos, <nombre> del modelo. Todas las series temporales deben terminar en la misma marca de tiempo y no pueden tener puntos de datos ausentes arbitrarios. Cuando el valor del parámetro MISSING_VALUE_SUBSTITUTION es Previous o una constante numérica, se revisarán automáticamente los puntos de datos ausentes siempre que sea posible."
Para evitar este error, puede especificar que Analysis Services proporcione automáticamente nuevos valores para rellenar los huecos mediante cualquiera de los métodos siguientes:
Utilizar un valor promedio. El promedio se calcula utilizando todos los valores válidos en la misma serie de datos.
Utilizar el valor anterior. Puede sustituir los valores anteriores para varias celdas que falten, pero no puede rellenar los valores de iniciales.
Utilizar un valor constante que proporcione el usuario.
Para especificar que los huecos se rellenen calculando el promedio de los valores
En la pestaña Modelos de minería de datos, haga clic con el botón derecho en la columna Previsión y seleccione Establecer parámetros de algoritmo.
En el cuadro de diálogo Parámetros de algoritmo , en la fila MISSING_VALUE_SUBSTITUTION , haga clic en la columna Valor y escriba
Mean
.
Generar el modelo
Para usar el modelo, debe implementarlo en un servidor y procesarlo ejecutando los datos de aprendizaje a través del algoritmo.
Para procesar el modelo de pronóstico
En el menú Modelo de minería de datos de SQL Server Data Tools, seleccione Procesar estructura de minería de datos y Todos los modelos.
En la advertencia que pregunta si desea compilar e implementar el proyecto, haga clic en Sí.
En el cuadro de diálogo Process Mining Structure - Forecasting (Estructura de minería de datos de procesos: previsión), haga clic en Ejecutar.
Se abre el cuadro de diálogo Progreso del proceso para mostrar información acerca del procesamiento del modelo. El procesamiento del modelo puede tardar algún tiempo.
Cuando se complete el proceso, haga clic en Cerrar para salir del cuadro de diálogo Progreso del proceso .
Haga clic en Cerrar de nuevo para salir del cuadro de diálogo Estructura de minería de datos de procesos : previsión .
Siguiente tarea de la lección
Explorar el modelo de previsión (tutorial intermedio de minería de datos)
Consulte también
Microsoft Time Series Algorithm Technical Reference
Algoritmo de serie temporal de Microsoft
Requisitos y consideraciones de procesamiento (minería de datos)