Mejorar el rendimiento de un modelo de clasificación de categorías
Si la puntuación de rendimiento del modelo no es la que desea, hay algunas cosas que puede probar. Estas sugerencias pueden ayudarle a ajustar el modelo para mejorar su eficacia predictiva.
Agregar más datos de aprendizaje correctamente etiquetados
Cuantos más datos de entrenamiento etiquete correctamente, mejor será el rendimiento de su modelo. Por ejemplo, digamos que tiene una etiqueta Sí/No. Si la mayoría de los datos solo tienen un Sí en esta columna, es probable que el modelo de IA no aprenda mucho de estos datos. Si sus datos no están etiquetados correctamente, el modelo probablemente no aprenda muy bien. Es idóneo comenzar con un pequeño conjunto de ejemplos correctamente etiquetados, tal vez 100 o menos. A partir de ahí, puede continuar duplicando el número de ejemplos de forma iterativa y volver a entrenar cada vez, observando el cambio de rendimiento. En términos generales, cuantos más datos haya, mejor, pero los resultados decrecen cuando se agregan datos a medida que aumenta el conjunto de datos.
Más sugerencias
- Asegúrese de hacer un uso equilibrado de las etiquetas en los datos de entrenamiento. Por ejemplo: tiene cuatro etiquetas para 100 elementos de texto. Las dos primeras etiquetas (etiqueta1 y etiqueta2) se utilizan para 90 elementos de texto, pero los otros dos (etiqueta3 y etiqueta4) solo se utilizan en los 10 elementos de texto restantes. La falta de equilibrio puede hacer que su modelo tenga dificultades para predecir correctamente la etiqueta3 o etiqueta4.
- Asegúrese de entrenar su modelo utilizando datos similares a aquellos para los que espera el modelo.
Siguiente paso
Publicar su modelo de clasificación de categorías