Tipi di visualizzazioni

Articolo
11/07/2024

Questo articolo descrive i tipi di visualizzazioni disponibili per l'uso nei notebook di Azure Databricks e in Databricks SQL e illustra come creare un esempio di ogni tipo di visualizzazione.

Nota

Per informazioni sui tipi di visualizzazione disponibili per i dashboard di intelligenza artificiale/BI, vedere Tipi di visualizzazione del dashboard.

Grafico a barre

I grafici a barre rappresentano la modifica delle metriche nel tempo o per mostrare la somiglianza, simile a un grafico a torta .

Nota

I grafici a barre supportano le aggregazioni back-end, fornendo supporto per le query che restituiscono più di 64.000 righe di dati senza troncamento del set di risultati.

Esempio di grafico a barre

Valori di configurazione: per questa visualizzazione grafico a barre sono stati impostati i valori seguenti:

Colonna X:
- Colonna set di dati: o_orderdate
- Livello data: Months
Colonne Y:
- Colonna set di dati: o_totalprice
- Tipo di aggregazione: Sum
Raggruppa per (colonna del set di dati): o_orderpriority
Impilamento: Stack
Nome asse X (sostituzione valore predefinito): Order month
Nome asse Y (sostituzione valore predefinito): Total price

Opzioni di configurazione: per le opzioni di configurazione del grafico a barre, vedere Opzioni di configurazione del grafico.

Query SQL: per questa visualizzazione del grafico a barre è stata usata la query SQL seguente per generare il set di dati.

select * from samples.tpch.orders

Grafico a linee

I grafici a linee presentano la modifica in una o più metriche nel tempo.

Nota

I grafici a linee supportano le aggregazioni back-end, fornendo supporto per le query che restituiscono più di 64.000 righe di dati senza troncamento del set di risultati.

Esempio di grafico a linee

Valori di configurazione: per questa visualizzazione grafico a linee sono stati impostati i valori seguenti:

Colonna X:
- Colonna set di dati: o_orderdate
- Livello data: Years
Colonne Y:
- Colonna set di dati: o_totalprice
- Tipo di aggregazione: Average
Raggruppa per (colonna del set di dati): o_orderpriority
Nome asse X (sostituzione valore predefinito): Order year
Nome asse Y (sostituzione valore predefinito): Average price

Opzioni di configurazione: per le opzioni di configurazione del grafico a linee, vedere Opzioni di configurazione del grafico.

Query SQL: per questa visualizzazione del grafico a linee è stata usata la query SQL seguente per generare il set di dati.

select * from samples.tpch.orders

Grafico ad area

I grafici ad area combinano il grafico a linee e a barre per mostrare come i valori numerici di uno o più gruppi cambiano rispetto alla progressione di una seconda variabile, in genere quella del tempo. Vengono spesso usati per mostrare le modifiche al funnel di vendita nel tempo.

Nota

I grafici ad area supportano le aggregazioni back-end, fornendo supporto per le query che restituiscono più di 64.000 righe di dati senza troncamento del set di risultati.

Esempio di grafico ad area

Valori di configurazione: per questa visualizzazione grafico ad area sono stati impostati i valori seguenti:

Colonna X:
- Colonna set di dati: o_orderdate
- Livello data: Years
Colonne Y:
- Colonna set di dati: o_totalprice
- Tipo di aggregazione: Sum
Raggruppa per (colonna del set di dati): o_orderpriority
Impilamento: Stack
Nome asse X (sostituzione valore predefinito): Order year
Nome asse Y (sostituzione valore predefinito): Total price

Opzioni di configurazione: per le opzioni di configurazione del grafico ad area, vedere Opzioni di configurazione del grafico.

Query SQL: per questa visualizzazione del grafico ad aree, è stata usata la query SQL seguente per generare il set di dati.

select * from samples.tpch.orders

Grafici a torta

I grafici a torta mostrano la discrepanza tra le metriche. Non sono concepiti per trasmettere i dati delle serie temporali.

Nota

I grafici a torta supportano le aggregazioni back-end, fornendo il supporto per le query che restituiscono più di 64.000 righe di dati senza troncamento del set di risultati.

Esempio di grafico a torta

Valori di configurazione: per questa visualizzazione grafico a torta sono stati impostati i valori seguenti:

Colonna X (colonna del set di dati): o_orderpriority
Colonne Y:
- Colonna set di dati: o_totalprice
- Tipo di aggregazione: Sum
Etichetta (override del valore predefinito): Total price

Opzioni di configurazione: per le opzioni di configurazione del grafico a torta, vedere Opzioni di configurazione del grafico.

Query SQL: per questa visualizzazione grafico a torta è stata usata la query SQL seguente per generare il set di dati.

select * from samples.tpch.orders

Grafici istogrammi

Un istogramma traccia la frequenza in cui si verifica un determinato valore in un set di dati. Un istogramma consente di comprendere se un set di dati contiene valori raggruppati intorno a un numero ridotto di intervalli o se sono più distribuiti. Un istogramma viene visualizzato come grafico a barre in cui si controlla il numero di barre distinte (dette anche bin).

Nota

I grafici istogrammi supportano le aggregazioni back-end, fornendo supporto per le query che restituiscono più di 64.000 righe di dati senza troncamento del set di risultati.

Esempio di grafico a istogramma

Valori di configurazione: per questa visualizzazione del grafico a istogramma sono stati impostati i valori seguenti:

Colonna X (colonna del set di dati): o_totalprice
Number of bins (Numero di bin): 20
Nome asse X (sostituzione valore predefinito): Total price

Opzioni di configurazione: per le opzioni di configurazione del grafico a istogramma, vedere opzioni di configurazione del grafico istogramma.

Query SQL: per questa visualizzazione del grafico a istogramma, per generare il set di dati è stata usata la query SQL seguente.

select * from samples.tpch.orders

Grafico mappa termica

I grafici mappa termica combinano funzionalità di grafici a barre, impilamento e grafici a bolle che consentono di visualizzare i dati numerici usando i colori. Una tavolozza dei colori comune per una mappa termica mostra i valori più alti usando colori più caldi, ad esempio arancione o rosso, e i valori più bassi usando colori più freddi, ad esempio blu o viola.

Si consideri, ad esempio, la mappa termica seguente che visualizza le distanze più frequenti delle corse dei taxi in ogni giorno e raggruppa i risultati in base al giorno della settimana, alla distanza e alla tariffa totale.

Nota

I grafici della mappa termica supportano le aggregazioni back-end, fornendo supporto per le query che restituiscono più di 64.000 righe di dati senza troncamento del set di risultati.

Esempio di mappa termica

Valori di configurazione: per questa visualizzazione grafico della mappa termica sono stati impostati i valori seguenti:

Colonna X (colonna del set di dati): o_orderpriority
Colonne Y (colonna del set di dati): o_orderstatus
Colonna Colore:
- Colonna set di dati: o_totalprice
- Tipo di aggregazione: Average
Nome asse X (sostituzione valore predefinito): Order priority
Nome asse Y(override valore predefinito): Order status
Combinazione di colori (sostituzione valore predefinito): YIGnBu

Opzioni di configurazione: per le opzioni di configurazione della mappa termica, vedere Opzioni di configurazione del grafico mappa termica.

Query SQL: per questa visualizzazione grafico mappa termica è stata usata la query SQL seguente per generare il set di dati.

select * from samples.tpch.orders

Grafico a dispersione

Le visualizzazioni a dispersione vengono comunemente usate per mostrare la relazione tra due variabili numeriche. Inoltre, una terza dimensione può essere codificata con colore per mostrare in che modo le variabili numeriche sono diverse tra i gruppi.

Nota

I grafici a dispersione supportano le aggregazioni back-end, fornendo il supporto per le query che restituiscono più di 64.000 righe di dati senza troncamento del set di risultati.

Esempio a dispersione

Valori di configurazione: per questa visualizzazione grafico a dispersione sono stati impostati i valori seguenti:

Colonna X (colonna del set di dati): l_quantity
Colonna Y (colonna del set di dati): l_extendedprice
Raggruppa per (colonna del set di dati): l_returnflag
Nome asse X (sostituzione valore predefinito): Quantity
Nome asse Y (sostituzione valore predefinito): Extended price

Opzioni di configurazione: per le opzioni di configurazione del grafico a dispersione, vedere Opzioni di configurazione del grafico.

Query SQL: per questa visualizzazione grafico a dispersione è stata usata la query SQL seguente per generare il set di dati.

select * from samples.tpch.lineitem

Grafico a sfere

I grafici a sfere sono grafici a dispersione in cui le dimensioni di ogni marcatore di punto riflettono una metrica pertinente.

Nota

I grafici a bolle supportano le aggregazioni back-end, fornendo il supporto per le query che restituiscono più di 64.000 righe di dati senza troncamento del set di risultati.

Esempio di bolle

Valori di configurazione: per questa visualizzazione grafico a bolle sono stati impostati i valori seguenti:

X (colonna del set di dati): l_quantity
Colonne Y (colonna del set di dati): l_extendedprice
Raggruppa per (colonna del set di dati): l-returnflag
Colonna dimensioni bolle (colonna del set di dati): l_tax
Coefficiente delle dimensioni delle bolle: 20
Nome asse X (sostituzione valore predefinito): Quantity
Nome asse Y (sostituzione valore predefinito): Extended price

Opzioni di configurazione: per le opzioni di configurazione del grafico a bolle, vedere Opzioni di configurazione del grafico.

Query SQL: per questa visualizzazione grafico a bolle è stata usata la query SQL seguente per generare il set di dati.

select * from samples.tpch.lineitem

Grafico a casella

La visualizzazione del grafico a casella mostra il riepilogo della distribuzione dei dati numerici, facoltativamente raggruppati per categoria. Usando una visualizzazione grafico a caselle, è possibile confrontare rapidamente gli intervalli di valori tra le categorie e visualizzare i gruppi di localizzazione, dispersione e asimmetria dei valori tramite i relativi quartili. In ogni casella la linea più scura mostra l'intervallo interquartile. Per altre informazioni sull'interpretazione delle visualizzazioni dei tracciati a casella, vedere l'articolo Grafico a casella su Wikipedia.

Nota

I grafici box supportano solo l'aggregazione per un massimo di 64.000 righe. Se un set di dati è maggiore di 64.000 righe, i dati verranno troncati.

Esempio di grafico a casella

Valori di configurazione: per questa visualizzazione del grafico a casella sono stati impostati i valori seguenti:

Colonna X (colonna del set di dati): l-returnflag
Colonne Y (colonna del set di dati): l_extendedprice
Raggruppa per (colonna del set di dati): l_shipmode
Nome asse X (sostituzione valore predefinito): Return flag1
Nome asse Y (sostituzione valore predefinito): Extended price

Opzioni di configurazione: per le opzioni di configurazione del grafico a caselle, vedere Opzioni di configurazione del grafico a caselle.

Query SQL: per questa visualizzazione del grafico a casella è stata usata la query SQL seguente per generare il set di dati.

select * from samples.tpch.lineitem

Grafico combinato

I grafici combinati combinano grafici a linee e a barre per presentare le modifiche nel tempo con la sproporzionata.

Nota

I grafici combinati supportano le aggregazioni back-end, fornendo supporto per le query che restituiscono più di 64.000 righe di dati senza troncamento del set di risultati.

Esempio combinato

Valori di configurazione: per questa visualizzazione del grafico combinato sono stati impostati i valori seguenti:

Colonna X (colonna del set di dati): l_shipdate
Colonne Y:
- Prima colonna del set di dati: l_extendedprice
- Tipo di aggregazione: media
- Seconda colonna del set di dati: l_quantity
- Tipo di aggregazione: media
Nome asse X (sostituzione valore predefinito): Ship date
Nome asse Y sinistro (valore predefinito override): Quantity
Nome dell'asse Y destro (sostituire il valore predefinito): Average price
Serie:
- Order1 (colonna del set di dati): AVG(l_extendedprice)
- Asse Y: a destra
- Tipo: Linea
- Order2 (colonna del set di dati): AVG(l_quantity)
- Asse Y: a sinistra
- Tipo: barra

Opzioni di configurazione: per le opzioni di configurazione del grafico combinato, vedere Opzioni di configurazione del grafico.

Query SQL: per questa visualizzazione del grafico combinato è stata usata la query SQL seguente per generare il set di dati.

select * from samples.tpch.lineitem

Analisi della coorte

Un'analisi della coorte esamina i risultati dei gruppi predeterminati, denominati coorti, mentre progredisce attraverso un set di fasi. La visualizzazione della coorte aggrega solo le date (consente aggregazioni mensili). Non esegue altre aggregazioni di dati all'interno del set di risultati. Tutte le altre aggregazioni vengono eseguite all'interno della query stessa.

Esempio di coorte

Valori di configurazione: per questa visualizzazione della coorte sono stati impostati i valori seguenti:

Data (bucket) (colonna di database): cohort_month
Fase (colonna di database): months
Dimensioni del popolamento del bucket (colonna del database): size
Valore di fase (colonna di database): active
Intervallo di tempo: monthly

Opzioni di configurazione: per le opzioni di configurazione della coorte, vedere Opzioni di configurazione del grafico di coorte.

Query SQL: per questa visualizzazione della coorte è stata usata la query SQL seguente per generare il set di dati.

-- match each customer with its cohort by month
with cohort_dates as (
  SELECT o_custkey, min(date_trunc('month', o_orderdate)) as cohort_month
  FROM samples.tpch.orders
  GROUP BY 1
),
-- find the size of each cohort
cohort_size as (
  SELECT cohort_month, count(distinct o_custkey) as size
  FROM cohort_dates
  GROUP BY 1
)
-- for each cohort and month thereafter, find the number of active customers
SELECT
  cohort_dates.cohort_month,
  ceil(months_between(date_trunc('month', samples.tpch.orders.o_orderdate), cohort_dates.cohort_month)) as months,
  count(distinct samples.tpch.orders.o_custkey) as active,
  first(size) as size
FROM samples.tpch.orders
  left join cohort_dates on samples.tpch.orders.o_custkey = cohort_dates.o_custkey
  left join cohort_size on cohort_dates.cohort_month = cohort_size.cohort_month
WHERE datediff(date_trunc('month', samples.tpch.orders.o_orderdate), cohort_dates.cohort_month) != 0
GROUP BY 1, 2
ORDER BY 1, 2

Visualizzazione contatore

I contatori visualizzano un singolo valore in modo prominente, con un'opzione per confrontarli con un valore di destinazione. Per usare i contatori, specificare la riga di dati da visualizzare nella visualizzazione contatore per la colonna valore e la colonna di destinazione.

Nota

Counter supporta solo l'aggregazione per un massimo di 64.000 righe. Se un set di dati è maggiore di 64.000 righe, i dati verranno troncati.

Esempio di contatore

Valori di configurazione: per questa visualizzazione contatore sono stati impostati i valori seguenti:

Colonna Valore
- Colonna set di dati: avg(o_totalprice)
- Riga 1:
Colonna di destinazione:
- Colonna set di dati: avg(o_totalprice)
- Riga 2:
Formattare il valore di destinazione: Abilita

Query SQL: per questa visualizzazione contatore è stata usata la query SQL seguente per generare il set di dati.

select o_orderdate, avg(o_totalprice)
from samples.tpch.orders
GROUP BY 1
ORDER BY 1 DESC

Visualizzazione a imbuto

La visualizzazione a imbuto consente di analizzare la modifica in una metrica in diverse fasi. Per usare l'imbuto, specificare una step colonna e .value

Nota

L'imbuto supporta solo l'aggregazione per un massimo di 64.000 righe. Se un set di dati è maggiore di 64.000 righe, i dati verranno troncati.

Esempio di imbuto

Valori di configurazione: per questa visualizzazione a imbuto sono stati impostati i valori seguenti:

Colonna passaggio (colonna del set di dati): o_orderstatus
Colonna valore (colonna del set di dati): Revenue

Query SQL: per questa visualizzazione a imbuto è stata usata la query SQL seguente per generare il set di dati.

SELECT o_orderstatus, sum(o_totalprice) as Revenue
FROM samples.tpch.orders
GROUP BY 1

Visualizzazione mappa choropleth

Nelle visualizzazioni choropleth, le località geografiche, ad esempio paesi o stati, sono colorate in base ai valori aggregati di ogni colonna chiave. La query deve restituire posizioni geografiche in base al nome.

Nota

Le visualizzazioni choropleth non eseguono aggregazioni di dati all'interno del set di risultati. Tutte le aggregazioni devono essere calcolate all'interno della query stessa.

Esempio di choropleth mappa

Valori di configurazione: per questa visualizzazione choropleth sono stati impostati i valori seguenti:

Mappa (colonna del set di dati): Countries
Colonna geografica (colonna del set di dati): Nation
Tipo geografico: nome breve
Colonna valore (colonna del set di dati): revenue
Modalità di clustering: equidistante

Opzioni di configurazione: per le opzioni di configurazione choropleth, vedere opzioni di configurazione choropleth.

Query SQL: per questa visualizzazione choropleth, è stata usata la query SQL seguente per generare il set di dati.

SELECT
initcap(n_name) as Country,
sum(c_acctbal)
FROM samples.tpch.customer
join samples.tpch.nation where n_nationkey = c_nationkey
GROUP BY 1

Visualizzazione mappa marcatori

Nelle visualizzazioni dei marcatori, un marcatore viene posizionato in corrispondenza di un set di coordinate sulla mappa. Il risultato della query deve restituire coppie di latitudine e longitudine.

Nota

L'indicatore non esegue aggregazioni di dati all'interno del set di risultati. Tutte le aggregazioni devono essere calcolate all'interno della query stessa.

Esempio di marcatore mappa

Questo esempio di marcatore viene generato da un set di dati che include valori di latitudine e longitudine, che non sono disponibili nei set di dati di esempio di Databricks. Per le opzioni di configurazione choropleth, vedere Opzioni di configurazione del marcatore.

Visualizzazione tabella pivot

Una visualizzazione tabella pivot aggrega i record di un risultato di una query in una nuova visualizzazione tabulare. È simile alle istruzioni PIVOT o GROUP BY in SQL. È possibile configurare la visualizzazione tabella pivot con i campi di trascinamento della selezione.

Nota

Le tabelle pivot supportano le aggregazioni back-end, fornendo supporto per le query che restituiscono più di 64.000 righe di dati senza troncamento del set di risultati. Tuttavia, la tabella pivot (legacy) supporta solo l'aggregazione per un massimo di 64.000 righe. Se un set di dati è maggiore di 64.000 righe, i dati verranno troncati.

Esempio di tabella pivot

Valori di configurazione: per questa visualizzazione tabella pivot sono stati impostati i valori seguenti:

Selezionare le righe (colonna del set di dati): l_retkurnflag
Selezionare le colonne (colonna del set di dati): l_shipmode
Cella
- Colonna set di dati: l_quantity
- Tipo di aggregazione: Somma

Query SQL: per questa visualizzazione tabella pivot, per generare il set di dati è stata usata la query SQL seguente.

select * from samples.tpch.lineitem

Sankey

Un diagramma sankey visualizza il flusso da un set di valori a un altro.

Nota

Le visualizzazioni Sankey non eseguono aggregazioni di dati all'interno del set di risultati. Tutte le aggregazioni devono essere calcolate all'interno della query stessa.

Esempio di Sankey

Query SQL: per questa visualizzazione Sankey è stata usata la query SQL seguente per generare il set di dati.

SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10

Sequenza sunburst

Un diagramma sunburst consente di visualizzare i dati gerarchici usando cerchi concentrici.

Nota

La sequenza sunburst non esegue aggregazioni di dati all'interno del set di risultati. Tutte le aggregazioni devono essere calcolate all'interno della query stessa.

Esempio di sunburst

Query SQL: per questa visualizzazione sunburst è stata usata la query SQL seguente per generare il set di dati.

SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10

Tabella

La visualizzazione tabella visualizza i dati in una tabella standard, ma con la possibilità di riordinare, nascondere e formattare manualmente i dati. Vedere Opzioni tabella.

Nota

Le visualizzazioni tabella non eseguono aggregazioni di dati all'interno del set di risultati. Tutte le aggregazioni devono essere calcolate all'interno della query stessa.

Per le opzioni di configurazione della tabella, vedere Opzioni di configurazione della tabella.

Cloud di Word

Una nuvola di parole rappresenta visivamente la frequenza in cui si verifica una parola nei dati.

Nota

Word Cloud supporta solo l'aggregazione per un massimo di 64.000 righe. Se un set di dati è maggiore di 64.000 righe, i dati verranno troncati.

Esempio di cloud di Word

Valori di configurazione: per questa visualizzazione cloud di word sono stati impostati i valori seguenti:

Colonna Words (colonna del set di dati): o_comment
Limite di lunghezza parole: 5
Limite frequenze: 2

Query SQL: per questa visualizzazione cloud di parole, è stata usata la query SQL seguente per generare il set di dati.

select * from samples.tpch.orders

Condividi tramite

Tipi di visualizzazioni

Grafico a barre

Grafico a linee

Grafico ad area

Grafici a torta

Grafici istogrammi

Grafico mappa termica

Grafico a dispersione

Grafico a sfere

Grafico a casella

Grafico combinato

Analisi della coorte

Visualizzazione contatore

Visualizzazione a imbuto

Visualizzazione mappa choropleth

Visualizzazione mappa marcatori

Visualizzazione tabella pivot

Sankey

Sequenza sunburst

Tabella

Cloud di Word

Commenti e suggerimenti

Risorse aggiuntive