Esercizio: Usare le query per esplorare le tendenze
Sono stati esaminati i dati non elaborati e l'intervallo di un set di dati meteorologici sconosciuti. In questa unità verranno usate visualizzazioni per vedere come vengono distribuiti i dati.
Diagramma temporale
Alcune delle colonne di dati visualizzate nell'ultima unità erano di tipo DateTime e rappresentavano gli orari di inizio e di fine degli eventi temporaleschi. Per vedere in quali date si sono verificati eventi temporaleschi, è possibile tracciare un grafico che rappresenti il conteggio delle voci in funzione del tempo.
Nell'unità precedente è stato usato un subset di 50 righe di dati, mentre questa unità sarà usato il set di dati completo.
La seguente query crea un grafico temporale con il numero di eventi temporaleschi per un intervallo di 8 ore in funzione del tempo.
Eseguire la query riportata di seguito:
StormEvents | summarize Count = count() by bin (StartTime, 8h) | render timechart
Dovrebbero essere visualizzati risultati simili all'immagine seguente:
Esaminare il grafo risultante. Sono visibili lacune o anomalie evidenti?
Eventi in base allo stato
Un altro approccio per esaminare la distribuzione dei dati consiste nel raggrupparli in base al luogo dell'evento, in questo caso lo stato, per identificare possibili tendenze nella distribuzione.
Eseguire la query riportata di seguito:
StormEvents | summarize event = count() by State | sort by event | render barchart
Dovrebbero essere visualizzati risultati simili all'immagine seguente:
Esaminare il grafo risultante. L'elenco comprende 67 stati diversi, compresi quelli che non sono stati ufficiali degli Stati Uniti, come le "Samoa americane" e le "acque delle Hawaii". Questo tipo di distribuzione geografica delle tempeste ha senso?
È possibile esaminare i dati sottostanti selezionando la scheda Tabella sopra il grafico. I numeri reali consentono di comprendere meglio la distribuzione dei dati?
Eventi in base alla posizione geografica
Abbiamo visto come il numero di eventi varia in base al tempo e allo stato. Il mapping dello schema mostrava che ogni voce relativa a un evento temporalesco contiene informazioni sulla latitudine e sulla longitudine. Esaminiamo come i dati si raggruppano su una mappa.
La seguente query raggruppa gli eventi per cella geografica e conteggia il numero di eventi in ogni cella. Questi risultati vengono visualizzati su una mappa in modo che le dimensioni del cerchio corrispondano al numero di eventi nella cella. Eseguire la query riportata di seguito:
StormEvents | project BeginLon, BeginLat | where isnotnull(BeginLat) and isnotnull(BeginLon) | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6) | project geo_s2cell_to_central_point(hash), count_summary | extend Events = "count" | render piechart with (kind = map)
Dovrebbero essere visualizzati risultati simili all'immagine seguente:
Provare a ingrandire premendo CTRL +. Dopo aver osservato i tipi di tempeste, è comprensibile che ci siano più tempeste di questo tipo nell'area nord-orientale degli Stati Uniti e nel Golfo del Messico?