Introducción

Completado

En el aprendizaje automático, los algoritmos se usan para entrenar modelos que predicen etiquetas desconocidas para los datos nuevos en función de las correlaciones entre las etiquetas conocidas y las características que se encuentran en los datos de entrenamiento. Según el algoritmo usado, es posible que tengan que especificar hiperparámetros para configurar cómo se entrena el modelo. Por ejemplo, el algoritmo de regresión logística utiliza un hiperparámetro de tasa de regularización para contrarrestar el sobreajuste. Además, los modelos de red neuronal de aprendizaje profundo usan hiperparámetros como la velocidad de aprendizaje a fin de controlar cómo se ajustan las ponderaciones durante el entrenamiento.

Nota:

El aprendizaje profundo es un campo académico con su terminología determinada propia. Los científicos de datos hacen referencia a los valores que se determinan a partir de las características de entrenamiento como parámetros, por lo que se necesita otro término para los valores que se usan para configurar el comportamiento del entrenamiento y que no se derivan de los datos de entrenamiento. De ahí nace el término hiperparámetro.

Los valores de hiperparámetros que seleccione para un algoritmo determinado pueden tener un efecto significativo en el modelo que entrena; por lo tanto, elegir los valores de hiperparámetros adecuados puede marcar la diferencia entre un modelo que predice bien cuando se usa con nuevos datos y un modelo que no lo hace.

En Azure Databricks, puede usar la biblioteca Hyperopt para automatizar el ajuste de hiperparámetros; se trata de un proceso en el que se entrenan y evalúan repetidamente modelos mediante diferentes combinaciones de hiperparámetros hasta que se encuentran aquellos valores que funcionan mejor para los datos.