Exercice - Créer un notebook Azure et importer des données

Effectué

La première chose à faire est de créer un notebook Azure. Les notebooks Azure sont inclus dans des projets, dont l’objectif principal est de regrouper tous les notebooks associés. Dans cette unité, vous allez créer un projet et ensuite y créer un notebook.

  1. Accédez à https://notebooks.azure.com dans votre navigateur

  2. Connectez-vous avec votre compte Microsoft.

  3. Cliquez sur Mes projets dans le menu en haut de la page.

  4. Cliquez sur le bouton + Nouveau projet en haut de la page « Mes projets ».

  5. Créez un projet nommé « Notebooks ML » ou quelque chose de similaire. Vous pouvez décocher la case « Public » si vous le souhaitez, mais si vous rendez le projet public, tous les notebooks qu’il contient peuvent être partagés avec d’autres personnes via des liens, des réseaux sociaux ou des e-mails. Si vous n’êtes pas sûr de votre choix, vous pourrez rendre facilement le notebook public ou privé à tout moment.

    Création d’un projet.

    Création d’un projet

  6. Cliquez sur + Nouveau, puis sélectionnez Notebook dans le menu pour ajouter un notebook au projet.

    Ajout d’un notebook au projet.

    Ajout d’un notebook au projet

  7. Donnez un nom comme « On-Time Flight Arrivals.ipynb » au notebook, puis sélectionnez Python 3.6 comme langage. Ceci crée un notebook avec un noyau Python 3.6 pour l’exécution du code Python. Un des principaux avantages des notebooks Azure est que vous pouvez utiliser différents langages en choisissant des noyaux différents.

    Création d’un notebook.

    Création d’un notebook

    Notez que l’extension de nom de fichier .ipynb signifie « IPython notebook ». Initialement appelés notebooks IPython (pour « Interactive Python »), les notebooks Jupyter prenaient en charge seulement Python comme langage de programmation. Le nom Jupyter est une combinaison de Julia, Python et R, qui sont les principaux langages de programmation pris en charge par Jupyter.

  8. Cliquez sur le notebook pour l’ouvrir et le modifier.

    Ouverture du notebook.

    Ouverture du notebook

Vous pouvez créer d’autres projets et notebooks au fur et à mesure que vous utilisez Azure Notebooks. Vous avez le choix de créer des notebooks à partir de zéro ou de charger des notebooks existants.

Les notebooks Jupyter sont très interactifs et, dans la mesure où ils peuvent inclure du code exécutable, ils fournissent une plateforme idéale pour la manipulation des données et pour la création de modèles prédictifs à partir de celles-ci.

  1. Entrez la commande suivante dans la première cellule du notebook :

    !curl https://topics.blob.core.windows.net/public/FlightData.csv -o flightdata.csv
    

    Conseil

    curl est une commande Bash. Vous pouvez exécuter des commandes Bash dans un notebook Jupyter en les préfixant d’un point d’exclamation. Cette commande télécharge un fichier CSV à partir du Stockage Blob Azure et l’enregistre avec le nom flightdata.csv.

  2. Cliquez sur le bouton Exécuter pour exécuter la commande curl.

    Importation d’un jeu de données.

    Importation d’un jeu de données

  3. Dans la deuxième cellule du notebook, entrez le code Python suivant pour charger flightdata.csv, créer un DataFrame Pandas à partir de celui-ci et afficher les cinq premières lignes.

    import pandas as pd
    
    df = pd.read_csv('flightdata.csv')
    df.head()
    
  4. Cliquez sur le bouton Exécuter pour exécuter le code. Vérifiez que la sortie ressemble à la sortie ci-dessous.

    Chargement du jeu de données.

    Chargement du jeu de données

    Le DataFrame que vous avez créé contient des informations sur les arrivées à l’heure d’une importante compagnie aérienne américaine. Il contient plus de 11 000 lignes et a 26 colonnes. (La sortie indique « 5 lignes », car la fonction head du DataFrame retourne seulement les cinq premières lignes.) Chaque ligne représente un vol et contient des informations comme l’origine, la destination, l’heure de départ planifiée, et si le vol est arrivé à temps ou en retard. Nous allons examiner les données plus en détail un peu plus loin dans ce module.

  5. Utilisez la commande File ->Save and Checkpoint pour enregistrer le notebook.

Utilisez la barre de défilement horizontale pour faire défiler vers la gauche et vers la droite, et visualiser ainsi toutes les colonnes du jeu de données. Combien de colonnes le jeu de données contient-il ? Pouvez-vous deviner ce que chaque colonne représente d’après son nom ?