Exercice : Jeter un premier coup d'œil à vos données

Effectué

Rappelez-vous que dans notre scénario, vous avez rencontré un nouveau jeu de données qui contient des informations météorologiques sur les tempêtes aux États-Unis. Dans cette leçon, vous aurez un premier aperçu des données elles-mêmes.

Examinez les données brutes

La première chose que vous souhaitez faire est d’examiner les données réelles pour savoir quelles colonnes existent, quel type de données se trouve dans ces colonnes et quelles sont les valeurs possibles. Vous n’avez pas besoin de voir toutes les lignes de la table de données, alors prenons une petite sélection de l’ensemble de la table.

  1. Exécutez la requête suivante pour prendre 50 lignes arbitraires de données.

    Exécuter la requête

    StormEvents
    | take 50
    

    Vous devriez obtenir des résultats qui ressemblent à l’image suivante, bien que les lignes spécifiques que vous voyez puissent être différentes :

    Capture d'écran montrant les résultats de la requête take 50.

  2. Examinez la table obtenue sous la requête, dans ce qui est appelé la Grille de résultats. Faites défiler vers le côté droit pour prendre note de toutes les colonnes. Pouvez-vous avoir une idée des types de données et des plages de valeurs dans ces colonnes ? N’oubliez pas que les champs affichés ne sont qu’un échantillonnage de la table entière.

Utilisez la grille de résultats pour réorganiser les données

La grille de résultats offre une gamme d’outils intégrés qui sont probablement des actions familières dans d’autres environnements. Par exemple, vous pouvez trier les données en fonction d’une certaine colonne.

Chacun des exemples suivants commence par les résultats de la requête take 50.

Triez les données sur une colonne

Pour trier sur une colonne spécifique, sélectionnez le nom de cette colonne dans la grille de résultats. La flèche qui apparaît à droite du nom de la colonne indique si elle est triée dans l’ordre croissant ou décroissant.

  1. Sélectionnez la colonne État.

    Capture d’écran montrant des colonnes triées par colonne d’état.

  2. Examinez la liste résultante. Voyez-vous des états apparaissant sur plusieurs lignes ? N’oubliez pas que vous examinez les 50 lignes que vous avez sélectionnées ci-dessus. Vous ne devez donc pas vous attendre à voir une liste complète.

Regrouper les résultats

En approfondissant le tri des données, vous pouvez regrouper ou agréger des résultats par champs communs. Vous pouvez vous rappeler que la liste triée ci-dessus contenait plusieurs entrées pour différents états.

  1. Sélectionnez l’icône de menu à droite de la colonne à trier. Dans ce cas, sélectionnez le menu situé à droite de la colonne État.
  2. Sélectionnez Grouper par État.
  3. Chaque état est suivi d’un nombre d’entrées associées. Sélectionnez la flèche à gauche du nom d’état pour développer ces entrées.

Capture d’écran montrant le processus de sélection d’un état et de regroupement par état dans l’interface utilisateur web d’Azure Data Explorer.

Sélectionnez un sous-ensemble de données

Maintenant que vous avez une idée du type de données existant dans votre table, vous pouvez sélectionner un sous-ensemble de ces données, par exemple uniquement des événements d’inondation.

  1. Dans la colonne EventType, sélectionnez les événements sur lesquels vous souhaitez filtrer. Maintenez la touche Shift du clavier enfoncée pour sélectionner plusieurs événements, tels que Flash Flood, Heavy Rain et Flood.
  2. Cliquez avec le bouton droit sur un champ sélectionné, puis sélectionnez Ajouter une sélection en tant que filtres. La requête précédente change pour ajouter des champs filtrés.
  3. Réexécutez la requête en sélectionnant le bouton Exécuter. Tous les événements résultants sont désormais l’un des types sélectionnés.

Capture d’écran montrant la sélection de cellules et l’ajout de la sélection en tant que filtres dans la requête.

Filtrez sur une valeur

Vous pouvez aussi filtrer sur une seule valeur. Visualisons tous les événements qui se sont produits dans l’État de l’Ohio.

  1. Sélectionnez l’icône de menu à droite de la colonne État.

  2. Sélectionnez l’icône d’entonnoir.

  3. Bien que vous puissiez rechercher n’importe quel type de correspondance de chaîne ou d’entier, vous voudrez rechercher toute colonne contenant le mot Ohio. Vous pouvez également utiliser ce filtre pour trouver des champs de données incomplets ou vides.

    Capture d’écran de la liste déroulante des opérateurs de chaîne.

  4. Sous le type de filtrage, entrez le mot Ohio. Notez que les résultats sont immédiatement filtrés.

    Capture d’écran montrant le filtre de colonne sur une valeur de chaîne.

Résumez les cellules sélectionnées

Dans le coin inférieur droit de la grille de résultats, les cellules sélectionnées sont résumées. Lorsque vous sélectionnez des valeurs entières, vous pouvez également visualiser un résumé statistique de ces valeurs.

  1. Faites défiler jusqu’à la colonne DamageProperty dans la grille de résultats.

  2. Cliquez et faites glisser une sélection de cellules dans cette colonne. Ces cellules sont mises en surbrillance par un arrière-plan bleu pour indiquer la sélection.

  3. Examinez le coin inférieur droit de la grille de résultats. Quelles sont les valeurs maximales et minimales affichées ? Ce résumé vous aide-t-il à comprendre la plage de données de cette colonne ?

    Capture d’écran montrant le résumé statistique des cellules entières sélectionnées.

Développez un champ dynamique

Faites défiler jusqu’à la dernière colonne de la table de données. Voyez-vous la colonne StormSummary ? Ce champ contient une grande quantité de données qui ne sont pas toutes visibles. Vous pouvez développer la cellule pour afficher toutes les informations à l’intérieur du champ dynamique.

  1. Sélectionnez l’icône Développer l’affichage en haut à droite de la grille de résultats.

  2. Sélectionnez Droite pour afficher les résultats développés dans le volet droit.

  3. Faites défiler jusqu’à la colonne la plus à droite de la table, StormSummary.

  4. Double-cliquez sur l’un des champs de cette colonne. Le champ se développera pour afficher le contenu dans un format plus facile à lire :

    Capture d’écran de l’expansion du champ dynamique de résumé de tempête.