Résumé

Effectué

Dans ce module, vous avez appris à utiliser Python pour explorer, visualiser et manipuler des données. L’exploration de données est au cœur de la science des données. Elle constitue un élément clé de l’analyse des données et du Machine Learning.

L’apprentissage automatique (Machine Learning) est une discipline de la science des données qui traite de la modélisation prédictive. En d’autres termes, le Machine Learning utilise des données pour créer des modèles prédictifs permettant de prédire des valeurs inconnues. Vous pouvez l’utiliser pour prévoir la quantité de nourriture qu’un supermarché doit commander ou identifier des plantes sur des photographies.

Le machine learning consiste à identifier les relations entre des valeurs de données qui décrivent des caractéristiques (par exemple la taille et la couleur d’une plante) et la valeur à prédire, le nom (par exemple l’espèce de la plante). Ces relations sont intégrées à un modèle par le biais d’un processus d’apprentissage.

Défi : Analyse de données de vol

Si les exercices de ce module vous ont donné envie d’explorer des données pour vous-même, pourquoi ne pas relever le défi d’un vrai jeu de données contenant des informations de vol du département des Transports des États-Unis ? Vous le trouverez dans le notebook 01 - Flights Challenge.ipynb.

Remarque

Le temps nécessaire à la réalisation de ce défi facultatif n’est pas compté dans la durée estimée de ce module d’apprentissage. Vous pouvez donc y consacrer autant de temps que vous voulez.