Compartir a través de


¿Qué es el aprendizaje automático automatizado (AutoML)?

El aprendizaje automático automatizado (AutoML) automatiza el proceso de aplicar aprendizaje automático en los datos. Dado un conjunto de datos, puede ejecutar AutoML para iterar por diferentes transformaciones de datos, algoritmos de aprendizaje automático e hiperparámetros para seleccionar el mejor modelo.

Nota:

Este artículo versa sobre la API de AutoML de ML.NET, que actualmente se encuentra en versión preliminar. El material puede estar sujetos a cambios.

¿Cómo funciona AutoML?

En general, el flujo de trabajo para entrenar modelos de aprendizaje automático es el siguiente:

  • Definición de un problema
  • Recopilación de datos
  • Preprocesamiento de datos
  • Entrenamiento de un modelo
  • Evaluación del modelo

Flujo de trabajo tradicional de entrenamiento de ML y AutoML

El preprocesamiento, el entrenamiento y la evaluación son procesos experimentales e iterativos que requieren realizar múltiples pruebas hasta lograr unos resultados satisfactorios. Dado que estas tareas tienden a ser repetitivas, AutoML puede ayudar a automatizar estos pasos. Aparte de la automatización, se usan técnicas de optimización durante el proceso de entrenamiento y evaluación para encontrar y seleccionar algoritmos e hiperparámetros.

¿Cuándo se debe usar AutoML?

Tanto si está empezando a usar el aprendizaje automático como si es un usuario experimentado, AutoML proporciona soluciones para automatizar el proceso de desarrollo de modelos.

  • Principiantes: si no está familiarizado con el aprendizaje automático, AutoML simplifica el proceso de desarrollo de modelos, ya que proporciona un conjunto de valores predeterminados que reducen el número de decisiones que debe tomar al entrenar el modelo. Así, podrá centrarse en los datos y en el problema que está intentando resolver, y dejar que AutoML haga el resto.
  • Usuarios experimentados: si tiene algún tipo de experiencia con el aprendizaje automático, puede personalizar, configurar y ampliar los valores predeterminados proporcionados por AutoML en función de sus necesidades y, al mismo tiempo, sacar partido de todas sus funcionalidades de automatización.

AutoML en ML.NET

  • Caracterizador: API útil para automatizar el preprocesamiento de datos.
  • Prueba: ejecución individual de optimización de hiperparámetros.
  • Experimento: conjunto de pruebas de AutoML. ML.NET proporciona una API genérica de creación de experimentos que establece opciones predeterminadas de los componentes individuales de canalización rastreable, espacio de búsqueda y optimizador.
  • Espacio de búsqueda: intervalo de opciones disponibles entre las que elegir hiperparámetros.
  • Optimizador: algoritmos usados para optimizar hiperparámetros. ML.NET admite los siguientes optimizadores:
    • Optimizador frugal de costes: implementa una optimización frugal de los hiperparámetros relacionados con los costes, que tiene en cuenta el coste de entrenamiento
    • Optimizador frugal de costes ECI: implementa un optimizador frugal de costes de los espacios de búsqueda jerárquicos. Este es el optimizador que AutoML usa de forma predeterminada.
    • SMAC: optimizador que usa bosques aleatorios para realizar optimizaciones bayesiana.
    • Búsqueda de cuadrícula: optimizador que funciona mejor con espacios de búsqueda pequeños.
    • Búsqueda aleatoria
  • Estimador rastreable: estimador de ML.NET que contiene un espacio de búsqueda.
  • Canalización rastreable: canalización de ML.NET que contiene uno o varios estimadores rastreables.
  • Ejecutor de pruebas: componente de AutoML que usa canalizaciones rastreables y configuraciones de prueba para generar resultados de prueba a partir del entrenamiento y la evaluación del modelo.

Se recomienda que los principiantes empiecen por las opciones predeterminadas proporcionadas por la API de experimento genérica. Aquellos usuarios más experimentados que busquen opciones de personalización, pueden usar los componentes de estimador rastreable, canalización rastreable, espacio de búsqueda, ejecutor de pruebas y optimizador.

Para obtener más información sobre cómo empezar a usar la API de AutoML, consulte la guía Cómo usar la API de ML automatizado (AutoML) de ML.NET.

Tareas admitidas

AutoML proporciona opciones predeterminadas preconfiguradas para las siguientes tareas:

  • Clasificación binaria
  • Clasificación multiclase
  • Regresión

Si necesita realizar otras tareas, puede crear su propio ejecutor de pruebas para habilitar esos escenarios. Para obtener más información, consulte la guía Cómo usar la API de ML automatizado (AutoML) de ML.NET.

Pasos siguientes