Résumé
Nous avons passé du temps à examiner comment améliorer les modèles de classification complexes, à la fois avec des données équilibrées et avec des données déséquilibrées. Nous avons découvert que nous identifions les problèmes et que nous améliorons nos modèles en :
- Évaluant mieux le type de modèle d’erreur.
- Rééquilibrant nos données ou en modifiant la façon dont notre modèle est évalué.
- Changeant l’architecture du modèle.
- Utilisant des hyperparamètres.
Lorsque vous utilisez des données complexes, les experts en apprentissage automatique consacrent souvent le plus de temps à la modification de l’architecture du modèle et à l’utilisation des hyperparamètres pour améliorer leurs modèles. Nous avons vu comment les mauvais paramètres peuvent nuire ou améliorer les performances du modèle. La taille du jeu de données en question est un facteur majeur. Souvent, lorsque nous avons des jeux de données plus petits, l’architecture de paramétrage et les hyperparamètres peuvent améliorer de façon significative les modèles. Avec des jeux de données très volumineux, ceux-ci peuvent toujours obtenir un faible gain de performances de nos modèles.