Introduction

Effectué

L’apprentissage des modèles ne constitue en aucun cas un processus parfaitement automatisé. Sa dépendance aveugle aux données risque de lui faire apprendre des éléments en fin de compte superflus ou passer à côté de choses effectivement utiles. Le matériel de formation suivant décrit quelques-unes des principales causes du sous-ajustement et du surajustement, ainsi que les actions possibles.

Scénario : Dressage de chiens de sauvetage en avalanche

Tout au long de ce module, nous allons utiliser l’exemple de scénario suivant pour expliquer le sous-ajustement et le surajustement. Ce scénario est conçu pour donner un exemple de ces concepts tels que vous pourriez les rencontrer lorsque vous programmez. Gardez à l’esprit que ces principes s’appliquent généralement à presque tous les types de modèles, et pas seulement à ceux qui sont abordés ici.

Il est temps pour votre association caritative de dresser une nouvelle génération de chiens à retrouver des randonneurs emportés par des avalanches. Il y a un débat au bureau pour savoir quels sont les chiens les plus performants : un grand chien est-il mieux adapté qu’un petit ? Les chiens doivent-ils être dressés lorsqu’ils sont jeunes ou lorsqu’ils sont plus vieux ? Heureusement, vous avez accès à des statistiques sur les sauvetages effectués au cours des dernières années. Comme le dressage revient cher, vous devez avoir la certitude que vos critères de sélection des chiens sont solides.

Prérequis

  • Connaissance des modèles Machine Learning

Objectifs d’apprentissage

Dans ce module vous allez :

  • Définir la normalisation des fonctionnalités.
  • Créer et utiliser des jeux de données de test.
  • Expliquer comment le fait de tester les modèles peut à la fois améliorer et nuire à la formation.