Sdílet prostřednictvím


Funkce oken v mapování toku dat

PLATÍ PRO: Azure Data Factory Azure Synapse Analytics

Tip

Vyzkoušejte si službu Data Factory v Microsoft Fabric, řešení pro analýzy typu all-in-one pro podniky. Microsoft Fabric zahrnuje všechno od přesunu dat až po datové vědy, analýzy v reálném čase, business intelligence a vytváření sestav. Přečtěte si, jak začít používat novou zkušební verzi zdarma.

Toky dat jsou k dispozici ve službě Azure Data Factory i v kanálech Azure Synapse. Tento článek se týká mapování toků dat. Pokud s transformacemi začínáte, přečtěte si úvodní článek Transformace dat pomocí mapování toku dat.

Následující články obsahují podrobnosti o funkcích oken podporovaných službou Azure Data Factory a Azure Synapse Analytics při mapování toků dat.

Seznam funkcí okna

Následující funkce jsou k dispozici pouze v transformacích oken.

Funkce Window Úloha
cumeDist Funkce CumeDist vypočítá pozici hodnoty vzhledem ke všem hodnotám v oddílu. Výsledkem je počet řádků předcházejících nebo rovno aktuálnímu řádku v pořadí oddílu děleného celkovým počtem řádků v oddílu okna. Všechny hodnoty vazby v pořadí se vyhodnotí na stejnou pozici.
denseRank Vypočítá pořadí hodnoty ve skupině hodnot zadaných v klauzuli order by v okně. Výsledkem je jeden plus počet řádků předcházejících nebo rovno aktuálnímu řádku v pořadí oddílu. Hodnoty nebudou v sekvenci vytvářet mezery. Funkce Dense Rank funguje i v případě, že data nejsou seřazená a hledají změny hodnot.
zaostávat Získá hodnotu prvního parametru vyhodnoceného n řádků před aktuálním řádkem. Druhým parametrem je počet řádků, které se mají vrátit zpět a výchozí hodnota je 1. Pokud není zadáno tolik řádků, je vrácena hodnota null, pokud není zadána výchozí hodnota.
olovo Získá hodnotu prvního parametru vyhodnoceného n řádků za aktuálním řádkem. Druhým parametrem je počet řádků, které mají vypadat dopředu, a výchozí hodnota je 1. Pokud není zadáno tolik řádků, je vrácena hodnota null, pokud není zadána výchozí hodnota.
nTile Funkce NTile rozdělí řádky pro každý oddíl okna do n kbelíků od 1 do maximálně n. Hodnoty kbelíku se budou lišit maximálně o 1. Pokud se počet řádků v oddílu rovnoměrně nerozdělí do počtu kontejnerů, pak se zbývající hodnoty distribuují jednou za kontejner počínaje prvním kontejnerem. Funkce NTile je užitečná pro výpočet tertiles, kvartilů, deciles a dalších běžných souhrnných statistik. Funkce vypočítá dvě proměnné během inicializace: Velikost běžného kbelíku bude mít přidaný jeden další řádek. Obě proměnné jsou založené na velikosti aktuálního oddílu. Během procesu výpočtu funkce sleduje aktuální číslo řádku, aktuální číslo kbelíku a číslo řádku, ve kterém se kbelík změní (bucketThreshold). Když aktuální číslo řádku dosáhne prahové hodnoty kbelíku, hodnota kontejneru se zvýší o jednu a prahová hodnota se zvýší o velikost kbelíku (plus jeden další, pokud je aktuální kbelík vycpaný).
hodnost Vypočítá pořadí hodnoty ve skupině hodnot zadaných v klauzuli order by v okně. Výsledkem je jeden plus počet řádků předcházejících nebo rovno aktuálnímu řádku v pořadí oddílu. Hodnoty v sekvenci vytvoří mezery. Pořadí funguje i v případě, že data nejsou seřazená a hledají změny hodnot.
rowNumber Přiřadí sekvenční číslování řádků pro řádky v okně začínajícím číslem 1.