Exercice : Utiliser des requêtes pour explorer les tendances
Vous avez exploré les données brutes et la plage d’un jeu de données météorologiques inconnu. Dans cette unité, vous utilisez des visualisations pour voir comment les données sont distribuées.
Graphique temporel
Rappelez-vous que certaines des colonnes de données que vous avez vues dans la dernière unité étaient de type DateTime et représentaient les heures de début et de fin des événements de tempête. Pour voir les dates qui ont des événements de données de tempête, vous pouvez tracer un certain nombre d’entrées en fonction du temps.
Notez que l’unité précédente a utilisé un sous-ensemble de 50 lignes de données, tandis que cette unité utilise le jeu de données complet.
La requête suivante crée un diagramme horaire du nombre d’événements de tempête par tranche de 8 heures.
Exécutez la requête suivante :
StormEvents | summarize Count = count() by bin (StartTime, 8h) | render timechart
Vous devez obtenir des résultats qui ressemblent à l’image suivante :
Examinez le graphe obtenu. Est-ce que vous voyez des trous ou des anomalies évidents ?
Événements par État
Une autre façon d’examiner la distribution des données est de regrouper les données par localisation de l’événement (dans le cas présent par état) pour voir les tendances qui peuvent être relevées dans la distribution.
Exécutez la requête suivante :
StormEvents | summarize event = count() by State | sort by event | render barchart
Vous devez obtenir des résultats qui ressemblent à l’image suivante :
Examinez le graphe obtenu. Il y a 67 États différents dans la liste, y compris ceux qui ne sont pas des états officiels des États-Unis, comme « American Samoa » et « Hawaii waters ». Ce type de distribution géographique des tempêtes vous paraît-il logique ?
Vous pouvez examiner les données sous-jacentes en sélectionnant l’onglet Table au-dessus du graphique. Les nombres réels vous aident-ils à mieux comprendre la distribution des données ?
Événements par localisation géographique
Vous avez vu comment le nombre d’événements varie selon l’heure et l’État. Rappelez-vous que le mappage de schéma a montré que chaque entrée d’événement de tempête contient des informations de latitude et de longitude. Voyons comment les données sont regroupées sur une carte.
La requête suivante regroupe les événements par cellule géographique et compte le nombre d’événements dans chaque cellule. Ces résultats sont affichés sur une carte, où la taille du cercle correspond au nombre d’événements de cette cellule. Exécutez la requête suivante :
StormEvents | project BeginLon, BeginLat | where isnotnull(BeginLat) and isnotnull(BeginLon) | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6) | project geo_s2cell_to_central_point(hash), count_summary | extend Events = "count" | render piechart with (kind = map)
Vous devez obtenir des résultats qui ressemblent à l’image suivante :
Essayez de zoomer en appuyant sur Ctrl +. Maintenant que vous avez vu les types de tempête représentés, est-ce qu’il vous paraît logique que ce type de tempête se produise davantage dans le nord-est des États-Unis et le golfe du Mexique ?