Introduction

Effectué

La classification est une forme de machine learning où vous entraînez un modèle pour prédire à quelle catégorie un élément appartient. Par exemple, un centre médical peut utiliser des données de diagnostic telles que la taille, le poids, la tension artérielle et le taux de glycémie d’un patient pour prédire si ce dernier est diabétique ou non.

Illustration des caractéristiques d’un diagnostic médical pour prédire le diabète.

Les données catégorielles ont des classes plutôt que des valeurs numériques. Certains types de données peuvent être numériques ou catégoriques. Par exemple, la durée d’une course peut être un temps numérique en secondes, ou une classe catégorielle : rapide, moyenne ou lente. D’autres types de données peuvent uniquement être catégoriels, comme un type de forme : cercle, triangle ou carré.

Prérequis

  • Connaissance des principes mathématiques de base
  • Une certaine expérience de la programmation en langage Python

Objectifs d’apprentissage

Dans ce module, vous allez apprendre :

  • Quand utiliser la classification
  • Comment effectuer l’apprentissage et l’évaluation d’un modèle de classification à l’aide de l’infrastructure Scikit-Learn