Compartir vía


Barrido y selección de modelos para la previsión en AutoML

Este artículo describe cómo el aprendizaje automático automatizado (AutoML) en Azure Machine Learning busca y selecciona modelos de previsión. Si está interesado en obtener más información sobre la metodología de previsión en AutoML, consulte Introducción a los métodos de previsión en AutoML. Para explorar ejemplos de entrenamiento para los modelos de previsión en AutoML, consulte Configuración de AutoML para entrenar un modelo de previsión de serie temporal con el SDK y la CLI.

Barrido de modelos en AutoML

La tarea central de AutoML es entrenar y evaluar varios modelos y elegir el mejor con respecto a la métrica principal dada. La palabra "modelo" aquí hace referencia a la clase de modelo (como ARIMA o Bosque aleatorio) y a la configuración de hiperparámetros específica que distingue los modelos dentro de una clase. Por ejemplo, ARIMA hace referencia a una clase de modelos que comparten una plantilla matemática y un conjunto de supuestos estadísticos. El entrenamiento, o ajuste, de un modelo ARIMA requiere una lista de números enteros positivos que especifiquen la forma matemática precisa del modelo. Estos valores son los hiperparámetros. Los modelos ARIMA(1, 0, 1) y ARIMA(2, 1, 2) tienen la misma clase, pero diferentes hiperparámetros. Estas definiciones pueden ajustarse por separado a los datos de entrenamiento y evaluarse entre sí. AutoML busca, o realiza un barrido, en diferentes clases de modelos y dentro de clases variando los hiperparámetros.

Métodos de barrido de hiperparámetros

En la tabla siguiente se muestran los distintos métodos de barrido de hiperparámetros que AutoML usa para diferentes clases de modelo:

Grupo de clases de modelo Tipo de modelo Método de barrido de hiperparámetros
Naive, Seasonal Naive, Average, Seasonal Average Serie temporal Sin barrido dentro de la clase debido a la simplicidad del modelo
Exponential Smoothing, ARIMA(X) Serie temporal Búsqueda de cuadrícula para barrido dentro de la clase
Prophet Regresión Sin barrido dentro de la clase
Linear SGD, LARS LASSO, Elastic Net, K Nearest Neighbors, Decision Tree, Random Forest, Extremely Randomized Trees, Gradient Boosted Trees, LightGBM, XGBoost Regresión El servicio de recomendaciones de modelos de AutoML explora dinámicamente los espacios de hiperparámetro.
ForecastTCN Regresión Lista estática de modelos seguida de la búsqueda aleatoria sobre el tamaño de red, la relación de omisión y la velocidad de aprendizaje

Para obtener una descripción de los distintos tipos de modelos, consulte la sección Modelos de previsión en AutoML del artículo de información general sobre métodos de previsión.

La cantidad de barrido que realiza AutoML depende de la configuración del trabajo de previsión. Puede especificar los criterios de detención como un límite de tiempo o un límite en el número de pruebas, o el número equivalentemente de modelos. La lógica de terminación anticipada se puede usar en ambos casos para detener el barrido si la métrica principal no mejora.

Selección de modelos en AutoML

AutoML sigue un proceso de tres fases para buscar y seleccionar modelos de previsión:

  • Fase 1: barrido de los modelos de series temporales y selección del mejor modelo de cada clase utilizando métodos de estimación de máxima probabilidad.

  • Fase 2: barrido de los modelos de regresión y clasificación de los mismos, junto con los mejores modelos de serie temporal de la fase 1, según los valores de métricas principales de los conjuntos de validación.

  • Fase 3: creación de un modelo de ensamblado a partir de los modelos con clasificación superior, cálculo de su métrica de validación y clasificación con los demás modelos.

El modelo con el valor de métrica con clasificación superior al final de la fase 3 se designa como el mejor modelo.

Importante

En la fase 3, AutoML calcula siempre las métricas sobre datos fuera de muestra que no se utilizan para ajustar los modelos. Este enfoque ayuda a protegerse frente a ajustes excesivos.

Configuraciones de validación

AutoML tiene dos configuraciones de validación: datos de validación cruzada y de validación explícita.

En el caso de la validación cruzada, AutoML usa la configuración de entrada para crear divisiones de datos en plegamientos de entrenamiento y validación. El orden de tiempo debe conservarse en estas divisiones. AutoML usa la llamada validación cruzada de origen gradual, que divide la serie en datos de entrenamiento y validación mediante un punto de tiempo de origen. Al deslizar el origen en el tiempo, se generan subconjuntos de validación cruzada. Cada plegamiento de validación contiene el siguiente horizonte de observaciones inmediatamente después de la posición del origen del plegamiento especificado. Esta estrategia conserva la integridad de los datos de serie temporal y elimina el riesgo de pérdida de información.

Diagrama que muestra los plegamientos de validación cruzada que separan los conjuntos de entrenamiento y validación en función del tamaño del paso de validación cruzada.

AutoML sigue el procedimiento de validación cruzada habitual: entrena un modelo distinto de cada plegamiento y calcula la media de las métricas de validación de todos los plegamientos.

La validación cruzada para los trabajos de previsión se configura estableciendo el número de plegamientos de validación cruzada y, opcionalmente, el número de períodos de tiempo entre dos plegamientos consecutivos de validación cruzada. Para más información y un ejemplo de configuración de la validación cruzada para la previsión, consulte Configuración de validación cruzada personalizada.

También puede traer sus propios datos de validación. Para más información, consulte Configuración de datos de entrenamiento, validación, validación cruzada y prueba en AutoML (SDK v1).