Esercizio - Visualizzare i dati con l'operatore di rendering
È stato usato un set di dati meteorologici per aggregare e confrontare il numero di determinati tipi di eventi di tempesta in stati degli Stati Uniti diversi per l'anno 2007. In questo caso, questi risultati verranno visualizzati con l'aiuto dei grafici in bin temporali.
Usando l'operatore render
.
Tenere presente che l'operatore summarize
è stato usato per raggruppare gli eventi in base a un campo comune, ad esempio Stato. Nell'unità precedente sono state usate versioni diverse dell'operatore count
per confrontare il numero e i tipi di eventi in base allo stato. La visualizzazione di questi risultati può essere aiutare a confrontare le attività tra stati.
Per visualizzare i risultati, si userà l'operatore render
. Questo operatore si trova alla fine di una query. All'interno dell'operatore render
si specifica il tipo di visualizzazione da usare, ad esempio columnchart
, barchart
, piechart
, scatterchart
, pivotchart
e altri. È anche possibile definire proprietà diverse della visualizzazione, ad esempio l'asse x o l'asse y.
In questo esempio si visualizzerà la query precedente usando un grafico a barre.
Eseguire la query seguente.
StormEvents | summarize count(), EventsWithDamageToCrops = countif(DamageCrops > 0), dcount(EventType) by State | sort by count_ | render barchart
Dovrebbero essere visualizzati risultati simili all'immagine seguente:
Si noti la legenda a destra del grafico a barre. Ogni valore nella legenda rappresenta una colonna di dati diversa riepilogata da Stato nella query. Provare a selezionare uno dei valori, ad esempio count_, per attivare o disattivare la visualizzazione di questi dati nel grafico a barre. Disattivando count_, si rimuove il conteggio totale e rimangono il conteggio degli eventi che hanno causato danni e il numero distinto di eventi. Dovrebbe essere visualizzato un grafico simile all'immagine seguente:
Esaminare il grafico a barre risultante. Quali dati analitici è possibile ottenere da esso? Si potrebbe notare, ad esempio, che il Texas ha visto il maggior numero di eventi di tempesta individuali, ma che nello Iowa c'è stata la più alta incidenza di eventi tempesta dannosi.
Raggruppare i valori usando la funzione bin()
Fino ad ora, sono state usate le funzioni di aggregazione per raggruppare gli eventi in base allo stato. Ora esamineremo la distribuzione delle tempeste nel corso dell'anno raggruppando i dati in base al tempo. I valori dell'ora presenti in ogni record sono l'ora di inizio e l'ora di fine. Raggruppiamo gli orari di inizio degli eventi per settimana, in modo da visualizzare il numero di tempeste che si sono verificate ogni settimana nel 2007.
Si userà la funzione bin()
, che raggruppa i valori in intervalli impostati. Ad esempio, si potrebbe disporre di dati per ogni giorno dell'anno e voler raggruppare queste date per settimana. In alternativa, si vogliono raggruppare i dati della popolazione in base ai bin di età. La sintassi di questo operatore è:
bin(
value,
roundTo)
Il valore bin può essere un numero, una data o un intervallo di tempo. Il conteggio verrà aggregato usando la funzione bin()
per conteggiare gli eventi alla settimana. Il valore da raggruppare è lo StartTime dell'evento tempesta, con la dimensione del bin roundTo di 7days o 7d in forma abbreviata. Infine, eseguire il rendering dei dati come columnchart per creare un istogramma.
Eseguire la query riportata di seguito:
StormEvents | summarize count() by bin(StartTime, 7d) | render columnchart
Dovrebbero essere visualizzati risultati simili all'immagine seguente:
Esaminare l'istogramma risultante. Passare il puntatore su una delle barre per visualizzare l'ora di inizio del bin (valore x) e il numero di eventi (valore y).
Usando l'operatore sum
.
Nella query precedente è stato esaminato il numero di tempeste nel tempo. Ora verranno esaminati i danni causati da queste tempeste. A questo scopo, si userà la funzione di aggregazione sum
, perché si vuole visualizzare la quantità totale di danni causati in ogni intervallo di tempo. Il set di dati con cui si sta lavorando ha due colonne correlate ai danni: DamageProperty e DamageCrops.
Nella query seguente si creerà prima di tutto una colonna calcolata che aggiunge queste due origini danni. Si creerà quindi un'aggregazione dei danni totali con bin settimanali. Infine, si eseguirà il rendering di un istogramma che rappresenta i danni settimanali causati da tutte le tempeste.
Eseguire la query riportata di seguito:
StormEvents | extend damage = DamageProperty + DamageCrops | summarize sum(damage) by bin(StartTime, 7d) | render columnchart
Dovrebbero essere visualizzati risultati simili all'immagine seguente:
La query precedente mostra i danni come una funzione temporale. Un altro modo per confrontare il danno è per tipo di evento. Eseguire la query seguente per usare un grafico a torta al fine di confrontare i danni causati da tipi di eventi diversi.
StormEvents | extend damage = DamageProperty + DamageCrops | summarize sum(damage) by EventType | render piechart
Dovrebbero essere visualizzati risultati simili all'immagine seguente:
Passare il puntatore del mouse su una delle sezioni del grafico a torta. Verrà visualizzato il valore assoluto (danni totali causati da questo tipo di evento) e la percentuale corrispondente del danno complessivo.