Řazení transformace v mapování toku dat
PLATÍ PRO: Azure Data Factory Azure Synapse Analytics
Tip
Vyzkoušejte si službu Data Factory v Microsoft Fabric, řešení pro analýzy typu all-in-one pro podniky. Microsoft Fabric zahrnuje všechno od přesunu dat až po datové vědy, analýzy v reálném čase, business intelligence a vytváření sestav. Přečtěte si, jak začít používat novou zkušební verzi zdarma.
Toky dat jsou k dispozici ve službě Azure Data Factory i v kanálech Azure Synapse. Tento článek se týká mapování toků dat. Pokud s transformacemi začínáte, přečtěte si úvodní článek Transformace dat pomocí mapování toku dat.
Transformace řazení umožňuje seřadit příchozí řádky v aktuálním datovém proudu. Můžete zvolit jednotlivé sloupce a seřadit je vzestupně nebo sestupně.
Poznámka:
Mapování toků dat se spouští v clusterech Spark, které distribuují data napříč několika uzly a oddíly. Pokud se rozhodnete data předělovat v následné transformaci, může dojít ke ztrátě řazení z důvodu opětovného přemísťování dat. Nejlepším způsobem, jak zachovat pořadí řazení v toku dat, je nastavit jeden oddíl na kartě Optimalizace transformace a zachovat transformaci Řazení co nejblíže jímce.
Konfigurace
Nerozlišují se malá a velká písmena: Jestli chcete při řazení řetězců nebo textových polí ignorovat malá a velká písmena
Seřadit pouze v rámci oddílů: Při spouštění toků dat ve Sparku je každý datový proud rozdělený do oddílů. Toto nastavení seřadí data pouze v rámci příchozích oddílů a neřadí celý datový proud.
Podmínky řazení: Vyberte sloupce, podle kterých se seřadíte, a v jakém pořadí se řazení děje. Pořadí určuje prioritu řazení. Zvolte, jestli se hodnoty null zobrazí na začátku nebo na konci datového streamu.
Počítané sloupce
Pokud chcete před použitím řazení upravit nebo extrahovat hodnotu sloupce, najeďte myší na sloupec a vyberte počítaný sloupec. Tím se otevře tvůrce výrazů, aby se místo použití hodnoty sloupce vytvořil výraz pro operaci řazení.
Skript toku dat
Syntaxe
<incomingStream>
sort(
desc(<sortColumn1>, { true | false }),
asc(<sortColumn2>, { true | false }),
...
) ~> <sortTransformationName<>
Příklad
Skript toku dat pro výše uvedenou konfiguraci řazení je v následujícím fragmentu kódu.
BasketballStats sort(desc(PTS, true),
asc(Age, true)) ~> Sort1
Související obsah
Po řazení můžete chtít použít agregační transformaci.