Résumé

Effectué

Nous avons terminé notre introduction à la classification : nous allons donc en récapituler quelques points clés.

Nous avons vu que la classification a de nombreux points communs avec la régression classique. Pour les deux approches, nous pouvons utiliser l’apprentissage supervisé, une fonction de coût, ainsi que des jeux de données de test et d’apprentissage afin d’estimer les performances dans le monde réel. Nous nous sommes concentrés ici sur la régression logistique, qui est quasiment un hybride entre ces deux types de modèles, et nous avons montré comment le calcul d’un seuil pour la sortie permet de produire une étiquette de catégorie, comme avalanche/no-avalanche.

Nous avons vu comment l’évaluation des modèles de classification peut être légèrement plus difficile que celle des modèles de régression, notamment parce que les fonctions de coûts impliquées sont souvent peu intuitives.

Nous avons également vu comment l’ajout et la combinaison de caractéristiques pouvaient améliorer notablement les performances du modèle. Nous avons surtout montré qu’il est essentiel de réfléchir à la signification des données pour obtenir le meilleur résultat.

Dans ce module, nous avons travaillé avec la régression logistique. Mais gardez à l’esprit que la plupart des sujets abordés ici s’appliquent également à de nombreux autres types de modèles de classification. Y compris les modèles qui tentent de prédire plus de deux catégories possibles.