Sdílet prostřednictvím


Typy vizualizací

Tento článek popisuje typy vizualizací, které jsou k dispozici v poznámkových blocích Azure Databricks a v Sql Databricks, a ukazuje, jak vytvořit příklad jednotlivých typů vizualizací.

Poznámka:

Další informace o typech vizualizací dostupných pro řídicí panely AI/BI najdete v tématu typy vizualizací řídicích panelů.

Sloupcový diagram

Pruhové grafy znázorňují změnu metrik v průběhu času nebo zobrazují proporcionalitu, podobně jako výsečový graf.

Poznámka:

Pruhové grafy podporují back-endové agregace, které poskytují podporu pro dotazy vracející více než 64 tisíc dat bez zkrácení výsledku set.

Příklad pruhového grafu

Konfigurace values: Pro vizualizaci tohoto pruhového grafu byly následující valuesset:

  • X column:
    • Datová sada column: o_orderdate
    • Úroveň data: Months
  • Y columns:
    • Dataset column: o_totalprice
    • Typ agregace: Sum
  • Seskupit podle datové sady (column): o_orderpriority
  • Stohování: Stack
  • Název osy X (přepsání výchozí hodnoty): Order month
  • Název osy Y (přepsat výchozí hodnotu): Total price

Možnosti konfigurace: Možnosti konfigurace pruhového grafu najdete v tématu Možnosti konfigurace grafu.

dotaz SQL: Pro tuto vizualizaci pruhového grafu se k generate dat setpoužil následující dotaz SQL.

select * from samples.tpch.orders

Spojnicový graf

Spojnicové grafy představují změnu v jedné nebo více metrikách v průběhu času.

Poznámka:

Spojnicové grafy podporují backendové agregace, které poskytují podporu pro dotazy vracejících více než 64 tisíc řádků dat bez zkrácení výsledku set.

Příklad spojnicového grafu

konfigurace values: Pro tuto vizualizaci spojnicového grafu byly setnásledující values:

  • X column:
    • Dataset column: o_orderdate
    • Úroveň data: Years
  • Y columns:
    • Datová sada column: o_totalprice
    • Typ agregace: Average
  • Seskupit podle (datová sada column): o_orderpriority
  • Název osy X (přepsání výchozí hodnoty): Order year
  • Název osy Y (přepsat výchozí hodnotu): Average price

Možnosti konfigurace: Možnosti konfigurace spojnicového grafu najdete v tématu Možnosti konfigurace grafu.

SQL dotaz: Pro tuto vizualizaci spojnicového grafu se k generate datům setpoužil následující SQL dotaz.

select * from samples.tpch.orders

Plošný graf

Plošné grafy kombinují spojnicový a pruhový graf, aby ukázaly, jak se číselné values jedné nebo více skupin mění v průběhu druhé proměnné, obvykle podle času. Často se používají k zobrazení změn trychtýře prodeje v čase.

Poznámka:

Plošné grafy podporují backendové agregace, které poskytují podporu pro dotazy vracející více než 64 tisíc řádků dat bez zkrácení výsledků set.

Příklad plošných grafů

Konfigurace values: Pro tuto vizualizaci plošného diagramu byly následující valuesset:

  • X column:
    • Datová sada column: o_orderdate
    • Úroveň data: Years
  • Y columns:
    • columndatová sada: o_totalprice
    • Typ agregace: Sum
  • Seskupte podle datové sady column: o_orderpriority
  • Stohování: Stack
  • Název osy X (přepsání výchozí hodnoty): Order year
  • Název osy Y (přepsat výchozí hodnotu): Total price

Možnosti konfigurace: Možnosti konfigurace plošných grafů najdete v tématu Možnosti konfigurace grafu.

dotaz SQL: Pro tuto vizualizaci plošného grafu se k generate dat setpoužil následující dotaz SQL.

select * from samples.tpch.orders

Výsečové grafy

Výsečové grafy zobrazují proporcionalitu mezi metrikami. Nejsou určeny pro předávání dat časových řad.

Poznámka:

Výsečové grafy podporují backendové agregace pro dotazy vracející více než 64 000 řádků dat, aniž by došlo ke zkrácení výsledku set.

Příklad výsečového grafu

konfigurace values: Pro tuto vizualizaci výsečového grafu byly následující valuesset:

  • X column (datová sada column): o_orderpriority
  • Y columns:
    • Datová sada column: o_totalprice
    • Typ agregace: Sum
  • Popisek (přepsání výchozí hodnoty): Total price

Možnosti konfigurace: Možnosti konfigurace výsečového grafu najdete v tématu Možnosti konfigurace grafu.

dotaz SQL: Pro tuto vizualizaci výsečového grafu se k generate dat setpoužil následující dotaz SQL.

select * from samples.tpch.orders

Histogramové grafy

Histogram vykreslí frekvenci výskytu dané hodnoty v datové sadě. Histogram vám pomůže pochopit, jestli datová sada obsahuje values, které jsou seskupené kolem malého počtu rozsahů nebo jsou rozprostřenější. Histogram se zobrazí jako pruhový graf, ve kterém řídíte počet jednotlivých pruhů (označovaných také jako intervaly).

Poznámka:

Grafy histogramů podporují back-endové agregace a poskytují podporu pro dotazy vracející více než 64 tisíc řádků dat bez zkrácení výsledku set.

Příklad histogramového grafu

konfigurace values: Pro vizualizaci histogramu byly následující valuesset:

  • X column (datová sada column): o_totalprice
  • Počet intervalů: 20
  • Název osy X (přepsání výchozí hodnoty): Total price

Možnosti konfigurace: Možnosti konfigurace histogramu grafu najdete v tématu možnosti konfigurace histogramu.

dotaz SQL: Pro tuto vizualizaci histogramu se k generate dat setpoužil následující dotaz SQL.

select * from samples.tpch.orders

Heatmap chart

Heatmapové grafy kombinují funkce pruhových grafů, skládacích a bublinových grafů, které umožňují vizualizovat číselná data pomocí barev. Běžná barevná paleta pro heat mapu zobrazuje nejvyšší values pomocí teplejších barev, jako je oranžová nebo červená, a nejnižší values pomocí chladnějších barev, jako je modrá nebo fialová.

Představte si například následující heat mapu, která vizualizuje nejčastěji se vyskytující vzdálenosti jízdy taxíkem v každém dni a seskupuje výsledky podle dne v týdnu, vzdálenosti a celkové jízdy.

Poznámka:

Heatmapové grafy podporují backendové agregace, které umožňují dotazy vracející více než 64 000 řádků dat bez zkrácení výsledků set.

Příklad heat mapy

Konfigurace values: Pro tuto vizualizaci heatmapy byly setnásledující values:

  • X column (datová sada column): o_orderpriority
  • Y columns (columndatové sady): o_orderstatus
  • Barva column:
    • columndatová sada: o_totalprice
    • Typ agregace: Average
  • Název osy X (přepsání výchozí hodnoty): Order priority
  • Název osy Y (přepsat výchozí hodnotu): Order status
  • Název barvy (přepsat výchozí hodnotu): Average price
  • Barevné schéma (přepsat výchozí hodnotu): YIGnBu

Možnosti konfigurace: Možnosti konfigurace heat mapy najdete v tématu Možnosti konfigurace grafu heat mapy.

dotaz SQL: Pro tuto vizualizaci teplotní mapy byl k generate datům setpoužit následující dotaz SQL.

select * from samples.tpch.orders

Bodový graf

Bodové vizualizace se běžně používají k zobrazení vztahu mezi dvěma číselnými proměnnými. Kromě toho lze třetí dimenzi zakódovat barvou, aby bylo vidět, jak se číselné proměnné liší mezi skupinami.

Poznámka:

Bodové grafy podporují back-endové agregace, které poskytují podporu pro dotazy vracející více než 64 tisíc řádků dat bez zkrácení výsledku set.

Bodový příklad

Konfigurace values: Pro tuto vizualizaci bodového grafu byly setnásledující values:

  • X column (datová sada column): l_quantity
  • Y column (datové sady column): l_extendedprice
  • Seskupte podle datové sady column: l_returnflag
  • Název osy X (přepsání výchozí hodnoty): Quantity
  • Název osy Y (přepsat výchozí hodnotu): Extended price

Možnosti konfigurace: Možnosti konfigurace bodového grafu najdete v tématu Možnosti konfigurace grafu.

dotaz SQL: Pro tuto vizualizaci bodového grafu se k generate dat setpoužil následující dotaz SQL.

select * from samples.tpch.lineitem

Bublinový graf

Bublinové grafy patří mezi bodové grafy where, přičemž velikost každé značky bodu odráží relevantní metriku.

Poznámka:

Bublinové grafy podporují back-endové agregace, které poskytují podporu pro dotazy vracející více než 64 tisíc dat bez zkrácení výsledku set.

Příklad bublin

Konfigurace values: Pro tuto vizualizaci bublinového grafu byly následující položky valuesset:

  • X (datová sada column): l_quantity
  • Y columns (columndatová sada): l_extendedprice
  • Seskupte podle (datová sada column): l_returnflag
  • Velikost bubliny column (datové sady column): l_tax
  • Koeficient velikosti bublin: 20
  • Proporcionální velikost bubliny: Area
  • Název osy X (přepsání výchozí hodnoty): Quantity
  • Název osy Y (přepsat výchozí hodnotu): Extended price

Možnosti konfigurace: Možnosti konfigurace bublinového grafu najdete v tématu Možnosti konfigurace grafu.

SQL dotaz: Pro vizualizaci tohoto bublinového grafu byl k generate datům setpoužit následující SQL dotaz.

select * from samples.tpch.lineitem where l_quantity < 45

Krabicový graf

Vizualizace krabicového grafu zobrazuje souhrn rozdělení číselných dat, volitelně seskupených podle kategorie. Pomocí vizualizace krabicového grafu můžete rychle porovnat rozsahy hodnot napříč kategoriemi a vizualizovat skupiny umístění, rozložení a nerovnoměrné distribuce values prostřednictvím jejich kvartilů. V každém rámečku zobrazuje tmavší čára oblast interquartilu. Další informace o interpretaci krabicových vizualizací grafů najdete v článku Box chart na Wikipedii.

Poznámka:

Krabicové grafy podporují agregaci až pro 64 000 řádků. Pokud je datová sada větší než 64 000 řádků, data budou zkrácena.

Příklad krabicového grafu

konfigurace values: Pro tuto vizualizaci krabicového diagramu byly setnásledující values:

  • X column (datová sada column): l_returnflag
  • columns Y (columndatové sady): l_extendedprice
  • Seskupení podle datové sady column: l_shipmode
  • Název osy X (přepsání výchozí hodnoty): Return flag
  • Název osy Y (přepsat výchozí hodnotu): Extended price

Možnosti konfigurace: Možnosti konfigurace krabicového grafu najdete v tématu Možnosti konfigurace krabicového grafu.

dotaz SQL: Pro tuto vizualizaci krabicového grafu byl k generate dat setpoužit následující dotaz SQL.

select * from samples.tpch.lineitem

Kombinovaný graf

Kombinované grafy kombinují spojnicové a pruhové grafy a prezentují změny v průběhu času pomocí proporcionality.

Poznámka:

Kombinované grafy podporují back-endové agregace a poskytují podporu pro dotazy vracející více než 64 tisíc řádků dat bez zkrácení výsledku set.

Příklad se seznamem

Konfigurace values: Pro tuto vizualizaci kombinovaného grafu byly následující valuesset:

  • X column:
    • Datová sada column: l_shipdate
    • Úroveň data: Months
  • Y columns:
    • První datová sada column: l_extendedprice
    • Typ agregace: průměr
    • Druhá datová sada column: l_quantity
    • Typ agregace: průměr
  • Název osy X (přepsání výchozí hodnoty): Ship date
  • Název osy Y vlevo (přepsat výchozí hodnotu): Quantity
  • Název osy Y vpravo (přepsat výchozí hodnotu): Average price
  • Řada:
    • Order1 (datová sada column): AVG(l_extendedprice)
    • Osa Y: vpravo
    • Typ: Čára
    • Order2 (datová sada column): AVG(l_quantity)
    • Osa Y: vlevo
    • Typ: Pruh

Možnosti konfigurace: Možnosti konfigurace kombinovaného grafu najdete v tématu Možnosti konfigurace grafu.

SQL dotaz: Pro tuto vizualizaci kombinovaného grafu byl použit následující SQL dotaz k generate dat set.

select * from samples.tpch.lineitem

Analýza kohorty

Analýza kohorty zkoumá výsledky předem určených skupin označovaných jako kohorty při procházení set fází. Vizualizace kohorty agreguje pouze data (umožňuje měsíční agregace). Neprovádí žádné jiné agregace dat v rámci výsledku set. Všechny ostatní agregace se provádějí v samotném dotazu.

Příklad kohorty

Konfigurace values: Pro tuto vizualizaci skupiny byly následující valuesset:

  • Datum (kategorie) (databáze column): cohort_month
  • Fáze (databáze column): months
  • Velikost bucketu v databázi (column): size
  • Hodnota fáze z databáze column: active
  • Časový interval: monthly

Možnosti konfigurace: Možnosti konfigurace kohorty najdete v tématu Možnosti konfigurace kohorty grafu.

dotaz SQL: Pro tuto vizualizaci kohorty byl použit následující dotaz SQL k generate dat set.

-- match each customer with its cohort by month
with cohort_dates as (
  SELECT o_custkey, min(date_trunc('month', o_orderdate)) as cohort_month
  FROM samples.tpch.orders
  GROUP BY 1
),
-- find the size of each cohort
cohort_size as (
  SELECT cohort_month, count(distinct o_custkey) as size
  FROM cohort_dates
  GROUP BY 1
)
-- for each cohort and month thereafter, find the number of active customers
SELECT
  cohort_dates.cohort_month,
  ceil(months_between(date_trunc('month', samples.tpch.orders.o_orderdate), cohort_dates.cohort_month)) as months,
  count(distinct samples.tpch.orders.o_custkey) as active,
  first(size) as size
FROM samples.tpch.orders
  left join cohort_dates on samples.tpch.orders.o_custkey = cohort_dates.o_custkey
  left join cohort_size on cohort_dates.cohort_month = cohort_size.cohort_month
WHERE datediff(date_trunc('month', samples.tpch.orders.o_orderdate), cohort_dates.cohort_month) != 0
GROUP BY 1, 2
ORDER BY 1, 2

Zobrazení čítače

Čítače zobrazují jednu hodnotu zřetelně s možností jejich porovnání s cílovou hodnotou. Chcete-li použít čítače, určete, který řádek dat se má zobrazit ve vizualizaci čítače pro hodnotu Column a cílovou hodnotu Column.

Poznámka:

Čítač podporuje pouze agregaci až pro 64 000 řádků. Pokud je datová sada větší než 64 000 řádků, data budou zkrácena.

Příklad čítače

Konfigurace values: Pro tuto vizualizaci čítače byly následující valuesset:

  • Hodnota column
    • Datová sada column: avg(o_totalprice)
    • Řádek 1:
  • Cílová column:
    • Sada dat column: avg(o_totalprice)
    • Řádek 2:
  • Formát cílové hodnoty: Povolit

dotaz SQL: Pro tuto vizualizaci čítačů se k generate dat setpoužil následující dotaz SQL.

select o_orderdate, avg(o_totalprice)
from samples.tpch.orders
GROUP BY 1
ORDER BY 1 DESC

Trychtýřová vizualizace

Vizualizace trychtýře pomáhá analyzovat změnu metriky v různých fázích. Chcete-li použít trychtýř, zadejte step a valuecolumn.

Poznámka:

Trychtýř podporuje agregaci až pro 64 000 řádků. Pokud je datová sada větší než 64 000 řádků, data budou zkrácena.

Trychtýřový příklad

konfigurace values: Pro tuto vizualizaci trychtýře byly následující valuesset:

  • Krok column (datové sady column): o_orderstatus
  • Hodnota column (datová sada column): Revenue

dotaz SQL: Pro tuto trychtýřovou vizualizaci byl k generate dat setpoužit následující dotaz SQL.

SELECT o_orderstatus, sum(o_totalprice) as Revenue
FROM samples.tpch.orders
GROUP BY 1

Vizualizace mapy (Choropleth)

V choropleth vizualizacích jsou zeměpisné lokality, jako jsou země nebo státy, obarvené podle agregované values každého klíčového column. Dotaz musí vracet geografická umístění podle názvu.

Poznámka:

Vizualizace Choropleth nedělají žádné agregace dat v rámci výsledku set. Všechny agregace se musí vypočítat v samotném dotazu.

Příklad mapování choropleth

konfigurace values: Pro tuto vizualizaci choropleth byly setnásledující values:

  • Mapa (datová sada column): Countries
  • Geografická column (datová sada column): Country
  • Zeměpisný typ: Krátký název
  • Hodnota column (datová sada column): Revenue
  • Režim clusteringu: ekvividantní

Možnosti konfigurace: Možnosti konfigurace choropleth najdete v tématu možnosti konfigurace choropleth.

Dotaz SQL: Pro tuto choroplethovou vizualizaci se použil následující SQL dotaz pro generate dat set.

SELECT
initcap(n_name) as Country,
sum(c_acctbal)
FROM samples.tpch.customer
join samples.tpch.nation where n_nationkey = c_nationkey
GROUP BY 1

Vizualizace mapy značek

Ve vizualizacích značek se značka umístí na set souřadnic na mapě. Výsledek dotazu musí vracet páry zeměpisné šířky a délky.

Poznámka:

Marker neprovádí žádné agregace dat ve výsledku set. Všechny agregace se musí vypočítat v samotném dotazu.

Příklad mapové značky

Tento příklad značky se vygeneruje z datové sady, která zahrnuje values zeměpisné šířky i délky – které nejsou dostupné v ukázkových datových sadách Databricks. Možnosti konfigurace choropleth najdete v tématu Možnosti konfigurace značek.

vizualizace Pivottable

Vizualizace pivottable agreguje záznamy z výsledku dotazu do nového tabulkového zobrazení. Podobá se PIVOT příkazům nebo GROUP BY příkazům v SQL. Vizualizaci pivottable nakonfigurujete přetažením polí.

Poznámka:

Pivot tables podporují back-endové agregace a poskytují podporu pro dotazy vracející více než 64 tisíc řádků dat bez zkrácení výsledku set. Pivot table (starší verze) však podporují agregaci až pro 64 000 řádků. Pokud je datová sada větší než 64 000 řádků, data budou zkrácena.

Pivottable příklad

konfigurace values: Pro tuto vizualizaci byly následující pivottablevaluesset:

  • Select řádky datové sady column: l_returnflag
  • Select columns (datové sady column): l_shipmode
  • Buňka
    • Datová sada column: l_quantity
    • Typ agregace: Součet
    • Barevné buňky podle hodnoty: Zapnuto

dotaz SQL: Pro tuto vizualizaci pivottable se k generate dat setpoužil následující dotaz SQL.

select * from samples.tpch.lineitem

Sankey

Sankey diagram vizualizuje tok z jednoho set od values do druhého.

Poznámka:

Vizualizace Sankey neprovedou žádné agregace dat v rámci výsledku set. Všechny agregace se musí vypočítat v samotném dotazu.

Příklad Sankey

dotaz SQL: Pro tuto vizualizaci Sankey se k generate dat setpoužil následující dotaz SQL.

SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10

Vícevrstvá sekvence

Vícevrstvý diagram pomáhá vizualizovat hierarchická data pomocí soustředných kruhů.

Poznámka:

Sunburst sekvence neprovádí žádné agregace dat v rámci výsledku set. Všechny agregace se musí vypočítat v samotném dotazu.

Příklad vícevrstvý prstencový

dotaz SQL: Pro tuto sunburst vizualizaci byl následující SQL dotaz použit k generate dat set.

SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10

Table

Vizualizace table zobrazuje data ve standardním table, ale s možností ručního uspořádání, skrytí a formátování dat. Podívejte se na Table možnosti.

Poznámka:

Table vizualizace neprovádějí žádné agregace dat ve výsledku set. Všechny agregace se musí vypočítat v samotném dotazu.

Informace o možnostech konfigurace table naleznete v tématu table možnosti konfigurace.

Word cloud

Word cloud vizuálně představuje frekvenci výskytu slova v datech.

Poznámka:

Word Cloud podporuje agregaci pouze pro 64 000 řádků. Pokud je datová sada větší než 64 000 řádků, data budou zkrácena.

Příklad wordových cloudů

konfigurace values: Pro tuto vizualizaci slovního mraku byly setnásledující values: test

  • column slov (datová sada column): o_comment
  • Délka slova Limit: Min = 5
  • Frekvence limit: Min = 2

dotaz SQL: Pro tuto vizualizaci word cloudu byl použit k generate dat setnásledující dotaz SQL.

select * from samples.tpch.orders