Introduction

Effectué

Python est un des langages de programmation les plus répandus au monde. Il est largement utilisé dans la communauté de la science des données pour le machine learning et l’analyse statistique. Une des raisons de sa popularité est la disponibilité de milliers de bibliothèques open source, comme NumPy, Pandas, Matplotlib et scikit-learn, qui permettent aux programmeurs et aux chercheurs d’explorer, de transformer, d’analyser et de visualiser des données.

Azure Notebooks est une plateforme cloud qui permet de créer et d’exécuter des notebooks Jupyter. Jupyter est un environnement basé sur IPython, qui facilite la programmation interactive et l’analyse de données avec Python et d’autres langages de programmation. Azure Notebooks fournit Jupyter en tant que service gratuit. C’est un moyen pratique pour écrire du code Python sans devoir installer et gérer un serveur Jupyter. Il est en outre basé sur le web, ce qui en fait la solution idéale pour la collaboration en ligne.

Dans ce module, vous allez créer un notebook Azure, importer un jeu de données contenant des informations sur les arrivées à l’heure d’une importante compagnie aérienne américaine et charger le jeu de données dans le notebook. Ensuite, vous allez nettoyer le jeu de données avec Pandas, créer un modèle Machine Learning avec scikit-learn et utiliser Matplotlib pour visualiser la sortie du modèle.

Objectifs d’apprentissage

Dans ce module, vous allez :

  • Créer un notebook Jupyter dans Azure Notebooks, importer des données et visualiser les données chargées dans le notebook.
  • Utiliser Pandas pour nettoyer et préparer les données à utiliser pour le modèle Machine Learning.
  • Utiliser scikit-learn pour créer le modèle Machine Learning.
  • Utiliser Matplotlib pour visualiser les performances du modèle.