Visualisatietypen
Dit artikel bevat een overzicht van de typen visualisaties die beschikbaar zijn voor gebruik in Azure Databricks-notebooks en in Databricks SQL, en laat zien hoe u een voorbeeld van elk visualisatietype maakt.
Notitie
Zie Typen dashboardvisualisatiesvoor meer informatie over de visualisatietypen die beschikbaar zijn voor AI/BI-dashboards.
Staafdiagram
Staafdiagrammen vertegenwoordigen de wijziging in metrische gegevens in de loop van de tijd of om evenredigheid weer te geven, vergelijkbaar met een cirkeldiagram .
Notitie
Staafdiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.
Configuratiewaarden: voor deze visualisatie van een staafdiagram zijn de volgende waarden ingesteld:
- X-kolom:
- Gegevenssetkolom:
o_orderdate
- Datumniveau:
Months
- Gegevenssetkolom:
- Y-kolommen:
- Kolom gegevensset:
o_totalprice
- Aggregatietype:
Sum
- Kolom gegevensset:
- Groeperen op (kolom gegevensset):
o_orderpriority
- Stapelen:
Stack
- X-asnaam (standaardwaarde negeren):
Order month
- Y-asnaam (standaardwaarde negeren):
Total price
Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor de configuratie van staafdiagrammen.
SQL-query: voor deze visualisatie van een staafdiagram is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.orders
Lijndiagram
Lijndiagrammen presenteren de wijziging in een of meer metrische gegevens in de loop van de tijd.
Notitie
Lijndiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder afkapping van de resultatenset.
Configuratiewaarden: voor deze visualisatie van het lijndiagram zijn de volgende waarden ingesteld:
- X-kolom:
- Kolom gegevensset:
o_orderdate
- Datumniveau:
Years
- Kolom gegevensset:
- Y-kolommen:
- Kolom gegevensset:
o_totalprice
- Aggregatietype:
Average
- Kolom gegevensset:
- Groeperen op (kolom gegevensset):
o_orderpriority
- X-asnaam (standaardwaarde negeren):
Order year
- Y-asnaam (standaardwaarde negeren):
Average price
Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor configuratie van lijndiagrammen.
SQL-query: voor deze visualisatie van het lijndiagram is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.orders
Vlakdiagram
Vlakdiagrammen combineren het lijn- en staafdiagram om te laten zien hoe de numerieke waarden van een of meer groepen veranderen over de voortgang van een tweede variabele, meestal die van tijd. Ze worden vaak gebruikt om wijzigingen in de verkooptrechter in de loop van de tijd weer te geven.
Notitie
Vlakdiagrammen ondersteunen backend-aggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen gegevens retourneren zonder dat de resultatenreeks wordt afgekapt.
Configuratiewaarden: voor deze vlakdiagramvisualisatie zijn de volgende waarden ingesteld:
- X-kolom:
- Kolom gegevensset:
o_orderdate
- Datumniveau:
Years
- Kolom gegevensset:
- Y-kolommen:
- Gegevenssetkolom:
o_totalprice
- Aggregatietype:
Sum
- Gegevenssetkolom:
- Groeperen op (kolom gegevensset):
o_orderpriority
- Stapelen:
Stack
- X-asnaam (standaardwaarde negeren):
Order year
- Y-asnaam (standaardwaarde negeren):
Total price
Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor vlakdiagrammen.
SQL-query: voor deze vlakdiagramvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.orders
Cirkeldiagrammen
Cirkeldiagrammen tonen evenredigheid tussen metrische gegevens. Ze zijn niet bedoeld voor het overbrengen van tijdreeksgegevens.
Notitie
Cirkeldiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.
Configuratiewaarden: voor deze visualisatie van het cirkeldiagram zijn de volgende waarden ingesteld:
- X-kolom (gegevenssetkolom):
o_orderpriority
- Y-kolommen:
- Kolom gegevensset:
o_totalprice
- Aggregatietype:
Sum
- Kolom gegevensset:
- Label (standaardwaarde overschrijven):
Total price
Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor de configuratie van cirkeldiagrammen.
SQL-query: voor deze cirkeldiagramvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.orders
Histogrammen
In een histogram wordt de frequentie van een bepaalde waarde in een gegevensset weergegeven. Een histogram helpt u te begrijpen of een gegevensset waarden bevat die rond een klein aantal bereiken zijn geclusterd of meer zijn verdeeld. Een histogram wordt weergegeven als een staafdiagram waarin u het aantal afzonderlijke balken (ook wel bins genoemd) bepaalt.
Notitie
Histogrammen bieden ondersteuning voor back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.
Configuratiewaarden: Voor deze histogramvisualisatie zijn de volgende waarden ingesteld:
- X-kolom (gegevenssetkolom):
o_totalprice
- Aantal bins: 20
- X-asnaam (standaardwaarde negeren):
Total price
Configuratieopties: Zie configuratieopties voor histogramgrafiek voor opties voor histogramconfiguratie.
SQL-query: voor deze histogramvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.orders
Heatmapgrafiek
Heatmap-grafieken combineren functies van staafdiagrammen, stapelen en bellendiagrammen, zodat u numerieke gegevens kunt visualiseren met behulp van kleuren. Een gemeenschappelijk kleurenpalet voor een heatmap toont de hoogste waarden met warmere kleuren, zoals oranje of rood, en de laagste waarden met koelere kleuren, zoals blauw of paars.
Denk bijvoorbeeld aan de volgende heatmap die de meest voorkomende afstanden van taxiritten per dag visualiseert en de resultaten groepeert op de dag van de week, afstand en het totale tarief.
Notitie
Heatmapgrafieken ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder afkapping van de resultatenset.
configuratiewaarden: voor deze visualisatie van het heatmapdiagram zijn de volgende waarden ingesteld:
- X-kolom (gegevenssetkolom):
o_orderpriority
- Y-kolommen (gegevenssetkolom):
o_orderstatus
- Kleurkolom:
- Kolom gegevensset:
o_totalprice
- Aggregatietype:
Average
- Kolom gegevensset:
- X-asnaam (standaardwaarde negeren):
Order priority
- Naam van Y-as (standaardwaarde overschrijven):
Order status
- Kleurnaam (standaardwaarde overschrijven):
Average price
- Kleurenschema (standaardwaarde overschrijven):
YIGnBu
Configuratieopties: Zie configuratieopties voor heatmapgrafieken voor opties voor heatmapconfiguratie.
SQL-query: voor deze heatmapgrafiekvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.orders
Spreidingsdiagram
Spreidingsvisualisaties worden vaak gebruikt om de relatie tussen twee numerieke variabelen weer te geven. Daarnaast kan een derde dimensie worden gecodeerd met kleur om te laten zien hoe de numerieke variabelen verschillen tussen groepen.
Notitie
Spreidingsdiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.
Configuratiewaarden: Voor deze visualisatie van het spreidingsdiagram zijn de volgende waarden ingesteld:
- X-kolom (gegevenssetkolom):
l_quantity
- Y-kolom (gegevenssetkolom):
l_extendedprice
- Groeperen op (kolom gegevensset):
l_returnflag
- X-asnaam (standaardwaarde negeren):
Quantity
- Y-asnaam (standaardwaarde negeren):
Extended price
Configuratieopties: Zie configuratieopties voor spreidingsdiagrammen.
SQL-query: voor deze visualisatie van een spreidingsdiagram is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.lineitem
Bellendiagram
Bellendiagrammen zijn spreidingsdiagrammen waarbij de grootte van elke puntmarkering een relevante metrische waarde weergeeft.
Notitie
Bellendiagrammen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.
Configuratiewaarden: Voor deze visualisatie van bellendiagrammen zijn de volgende waarden ingesteld:
- X (gegevenssetkolom):
l_quantity
- Y-kolommen (gegevenssetkolom):
l_extendedprice
- Groeperen op (gegevenssetkolom):
l_returnflag
- Bellengroottekolom (gegevenssetkolom):
l_tax
- Belgroottecoëfficiënt: 20
- Belgrootte proportioneel aan:
Area
- X-asnaam (standaardwaarde negeren):
Quantity
- Y-asnaam (standaardwaarde negeren):
Extended price
Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor configuratie van bellendiagrammen.
SQL-query: voor deze visualisatie met bellendiagrammen is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.lineitem where l_quantity < 45
Box chart
In de visualisatie van het vakdiagram ziet u het distributieoverzicht van numerieke gegevens, optioneel gegroepeerd op categorie. Met behulp van een visualisatie van een boxgrafiek kunt u snel de waardebereiken in categorieën vergelijken en de lokaliteit, spreiding en scheefheid van de waarden visualiseren via hun kwartielen. In elk vak toont de donkerdere lijn het interquartielbereik. Zie het boxgrafiekartikel op Wikipedia voor meer informatie over het interpreteren van boxplotvisualisaties.
Notitie
Box-grafieken ondersteunen alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.
Configuratiewaarden: voor deze visualisatie van het vakdiagram zijn de volgende waarden ingesteld:
- X-kolom (kolom van gegevensset):
l_returnflag
- Y-kolommen (gegevenssetkolom):
l_extendedprice
- Groeperen op datasetkolom:
l_shipmode
- X-asnaam (standaardwaarde negeren):
Return flag
- Y-asnaam (standaardwaarde negeren):
Extended price
Configuratieopties: Zie de configuratieopties voor boxgrafieken voor opties voor de configuratie van boxgrafieken.
SQL-query: voor deze grafiekvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.lineitem
Combinatiegrafiek
Combinatiegrafieken combineren lijn - en staafdiagrammen om de wijzigingen in de loop van de tijd te presenteren met evenredigheid.
Notitie
Combinatiegrafieken ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt.
Configuratiewaarden: Voor deze combinatiegrafiek-visualisatie zijn de volgende waarden ingesteld:
- X-kolom:
- Kolom gegevensset:
l_shipdate
- Datumniveau:
Months
- Kolom gegevensset:
- Y-kolommen:
- Eerste gegevenssetkolom:
l_extendedprice
- Aggregatietype: gemiddelde
- Tweede gegevensset, kolom:
l_quantity
- Aggregatietype: gemiddelde
- Eerste gegevenssetkolom:
- X-asnaam (standaardwaarde negeren):
Ship date
- Naam van linker Y-as (standaardwaarde overschrijven):
Quantity
- Naam van rechter Y-as (standaardwaarde overschrijven):
Average price
- Reeks:
- Order1 (kolom gegevensset):
AVG(l_extendedprice)
- Y-as: rechts
- Type: Lijn
- Order2 (kolom gegevensset):
AVG(l_quantity)
- Y-as: links
- Type: Balk
- Order1 (kolom gegevensset):
Configuratieopties: Zie de configuratieopties voor grafieken voor opties voor combinatiegrafieken.
SQL-query: voor deze visualisatie van een combinatiegrafiek is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.lineitem
Cohortanalyse
Een cohortanalyse onderzoekt de resultaten van vooraf vastgestelde groepen, cohorten genoemd, terwijl ze door een reeks fasen gaan. De cohortvisualisatie aggregeert alleen over datums (dit maakt maandelijkse aggregaties mogelijk). Er worden geen andere aggregaties van gegevens in de resultatenset uitgevoerd. Alle andere aggregaties worden uitgevoerd binnen de query zelf.
Configuratiewaarden: voor deze cohortvisualisatie zijn de volgende waarden ingesteld:
- Datum (bucket) (databasekolom):
cohort_month
- Fase (databasekolom):
months
- Grootte van bucket-populatie (database kolom):
size
- Fasewaarde (databasekolom):
active
- Tijdsinterval:
monthly
Configuratieopties: Zie opties voor cohortgrafiekconfiguratie voor cohortconfiguraties.
SQL-query: voor deze cohortvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
-- match each customer with its cohort by month
with cohort_dates as (
SELECT o_custkey, min(date_trunc('month', o_orderdate)) as cohort_month
FROM samples.tpch.orders
GROUP BY 1
),
-- find the size of each cohort
cohort_size as (
SELECT cohort_month, count(distinct o_custkey) as size
FROM cohort_dates
GROUP BY 1
)
-- for each cohort and month thereafter, find the number of active customers
SELECT
cohort_dates.cohort_month,
ceil(months_between(date_trunc('month', samples.tpch.orders.o_orderdate), cohort_dates.cohort_month)) as months,
count(distinct samples.tpch.orders.o_custkey) as active,
first(size) as size
FROM samples.tpch.orders
left join cohort_dates on samples.tpch.orders.o_custkey = cohort_dates.o_custkey
left join cohort_size on cohort_dates.cohort_month = cohort_size.cohort_month
WHERE datediff(date_trunc('month', samples.tpch.orders.o_orderdate), cohort_dates.cohort_month) != 0
GROUP BY 1, 2
ORDER BY 1, 2
Tellerweergave
Tellers geven één enkele waarde prominent weer, met een optie om deze te vergelijken met een doelwaarde. Als u tellers wilt gebruiken, geeft u op welke gegevensrij moet worden weergegeven in de tellervisualisatie voor de waardekolom en doelkolom.
Notitie
Teller ondersteunt alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.
Configuratiewaarden: voor deze tellervisualisatie zijn de volgende waarden ingesteld:
- Waardekolom
- Gegevenssetkolom:
avg(o_totalprice)
- Rij 1:
- Gegevenssetkolom:
- Doelkolom:
- Gegevenssetkolom:
avg(o_totalprice)
- Rij 2:
- Gegevenssetkolom:
- Doelwaarde opmaken: inschakelen
SQL-query: voor deze tellervisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select o_orderdate, avg(o_totalprice)
from samples.tpch.orders
GROUP BY 1
ORDER BY 1 DESC
Trechtervisualisatie
De trechtervisualisatie helpt bij het analyseren van de wijziging in een metrische waarde in verschillende fasen. Om de trechter te gebruiken, geeft u een kolom step
en een kolom value
op.
Notitie
Trechter ondersteunt alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.
Configuratiewaarden: voor deze trechtervisualisatie zijn de volgende waarden ingesteld:
- Stapkolom (kolom van gegevensset):
o_orderstatus
- Waardekolom (gegevenssetkolom):
Revenue
SQL-query: voor deze trechtervisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
SELECT o_orderstatus, sum(o_totalprice) as Revenue
FROM samples.tpch.orders
GROUP BY 1
kaart (choropleet) visualisatie
In choropleth-visualisaties worden geografische locaties, zoals landen of staten, gekleurd op basis van de geaggregeerde waarden van elke belangrijke kolom. De query moet geografische locaties retourneren op naam.
Notitie
Choropleth-visualisaties voeren geen aggregaties van gegevens in de resultatenset uit. Alle aggregaties moeten worden berekend binnen de query zelf.
Configuratiewaarden: Voor deze choroplethvisualisatie zijn de volgende waarden ingesteld:
- Kaart (kolom gegevensset):
Countries
- Geografische kolom (gegevenssetkolom):
Country
- Geografisch type: Korte naam
- Waardekolom (gegevenssetkolom):
Revenue
- Clustermodus: equidistant
Configuratieopties: Zie choropleth-configuratieopties voor choropleth-configuratieopties.
SQL-query: voor deze choroplethvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
SELECT
initcap(n_name) as Country,
sum(c_acctbal)
FROM samples.tpch.customer
join samples.tpch.nation where n_nationkey = c_nationkey
GROUP BY 1
Visualisatie van markeringskaart
In markeringsvisualisaties wordt een markering op een set coördinaten op de kaart geplaatst. Het queryresultaat moet breedte- en lengtegraadparen retourneren.
Notitie
Markering voert geen aggregaties van gegevens in de resultatenset uit. Alle aggregaties moeten worden berekend binnen de query zelf.
Dit voorbeeld van een markering wordt gegenereerd op basis van een gegevensset met waarden voor breedtegraad en lengtegraad, die niet beschikbaar zijn in de Databricks-voorbeeldgegevenssets. Zie configuratieopties voor markeringen voor choropleth-configuratieopties.
Visualisatie van draaitabellen
Met een draaitabelvisualisatie worden records van een queryresultaat samengevoegd in een nieuwe tabelweergave. Het is vergelijkbaar met PIVOT
of GROUP BY
instructies in SQL. U configureert de draaitabelvisualisering door velden te slepen en neer te zetten.
Notitie
Draaitabellen ondersteunen back-endaggregaties en bieden ondersteuning voor query's die meer dan 64.000 rijen met gegevens retourneren zonder dat de resultatenset wordt afgekapt. Draaitabel (verouderd) ondersteunt echter alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.
Configuratiewaarden: voor deze draaitabelvisualisatie zijn de volgende waarden ingesteld:
- Rijen selecteren (datasetkolom):
l_returnflag
- Kolommen selecteren (gegevenssetkolom):
l_shipmode
- Cel
- Kolom gegevensset:
l_quantity
- Aggregatietype: Som
- Kleurcellen op waarde: Aan
- Kolom gegevensset:
SQL-query: voor deze draaitabelvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.lineitem
Sankey
Een sankey-diagram visualiseert de stroom van de ene set waarden naar de andere.
Notitie
Sankey-visualisaties voeren geen aggregaties van gegevens uit binnen de resultatenset. Alle aggregaties moeten worden berekend binnen de query zelf.
SQL-query: voor deze Sankey-visualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10
Zonnestraalreeks
Een zonnestraaldiagram helpt bij het visualiseren van hiërarchische gegevens met behulp van concentrische cirkels.
Notitie
Sunburst-volgorde doet geen aggregaties van gegevens binnen de resultaatset. Alle aggregaties moeten worden berekend binnen de query zelf.
SQL-query: voor deze zonnestraalvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10
Tafel
In de tabelvisualisatie worden gegevens in een standaardtabel weergegeven, maar met de mogelijkheid om de gegevens handmatig te ordenen, te verbergen en op te maken. Zie Tabelopties.
Notitie
Tabelvisualisaties voeren geen aggregaties van gegevens in de resultatenset uit. Alle aggregaties moeten worden berekend binnen de query zelf.
Zie voor opties voor tabelconfiguratie.
Word-cloud
Een woordwolk vertegenwoordigt de frequentie van een woord dat in de gegevens voorkomt.
Notitie
Word Cloud ondersteunt alleen aggregatie voor maximaal 64.000 rijen. Als een gegevensset groter is dan 64.000 rijen, worden gegevens afgekapt.
Configuratiewaarden: voor deze word cloudvisualisatie zijn de volgende waarden ingesteld: test
- Woordenkolom (gegevensset kolom):
o_comment
- Lengtelimiet voor woorden: Min = 5
- Frequentielimiet: Min = 2
SQL-query: voor deze word cloudvisualisatie is de volgende SQL-query gebruikt om de gegevensset te genereren.
select * from samples.tpch.orders