Ce navigateur n’est plus pris en charge.
Effectuez une mise à niveau vers Microsoft Edge pour tirer parti des dernières fonctionnalités, des mises à jour de sécurité et du support technique.
Pourquoi nettoyer nos données avant d’effectuer l’entraînement ?
La suppression de lignes de données rend notre modèle plus puissant.
Le nettoyage des données nous aide à sélectionner des fonctionnalités qui aident à améliorer le niveau de performance du modèle.
La suppression des lignes comportant des erreurs empêche celles-ci de tromper le processus d’entraînement.
Quel type de données est le mieux encodé avec des vecteurs 1 parmi n ?
Données ordinales
Données catégorielles avec deux valeurs possibles
Données catégorielles avec au moins trois valeurs
Qu’est-ce qu’un échantillon de données ? Qu’est-ce qu’une population ?
Un échantillon correspond à toutes les données possibles qui nous intéressent. Une population est le sous-ensemble des données que nous avons réellement sous la main.
L’analyse et l’échantillon font référence aux données que nous utilisons pour effectuer l'apprentissage de notre modèle.
Une population correspond à toutes les données possibles qui nous intéressent. Un échantillon est le sous-ensemble des données que nous avons réellement sous la main.
Vous avez un modèle qui ne fonctionne pas bien. Laquelle de ces options ne contribue certainement pas à améliorer ses performances ?
Ajout d’autres exemples (lignes).
Ajout de quelques caractéristiques (colonnes) dont vous savez qu’elles sont liées à ce que le modèle tente de prédire.
Ajout d’un grand nombre de caractéristiques que vous savez ne pas être liées à ce que le modèle tente de prédire.
Vous devez répondre à toutes les questions avant de vérifier votre travail.
Cette page a-t-elle été utile ?