Resumen
Hemos dedicado algún tiempo a estudiar cómo mejorar los modelos de clasificación complejos, tanto con datos equilibrados como con datos desequilibrados. Hemos descubierto que identificamos los problemas y mejoramos nuestros modelos mediante lo siguiente:
- Una mejor evaluación de los tipos de errores que está cometiendo el modelo.
- El reequilibrio de los datos o la modificación de la forma en que se evalúa el modelo.
- El cambio de la arquitectura del modelo.
- El trabajo con hiperparámetros.
Cuando trabajan con datos complejos, los expertos en aprendizaje automático suelen dedicar la mayor parte del tiempo a modificar la arquitectura del modelo y a trabajar con los hiperparámetros para mejorar sus modelos. Hemos visto cómo la configuración incorrecta puede dañar o mejorar el rendimiento del modelo. Un factor importante que decide esto es el tamaño del conjunto de datos en cuestión. A menudo, cuando tenemos conjuntos de datos más pequeños, el ajuste de la arquitectura y los hiperparámetros puede mejorar considerablemente los modelos. Con conjuntos de datos muy grandes, a menudo se puede obtener una pequeña ganancia de rendimiento de nuestros modelos.