Transformatie sorteren in toewijzingsgegevensstroom
VAN TOEPASSING OP: Azure Data Factory
Azure Synapse Analytics
Tip
Probeer Data Factory uit in Microsoft Fabric, een alles-in-één analyseoplossing voor ondernemingen. Microsoft Fabric omvat alles, van gegevensverplaatsing tot gegevenswetenschap, realtime analyses, business intelligence en rapportage. Meer informatie over het gratis starten van een nieuwe proefversie .
Gegevensstromen zijn beschikbaar in Zowel Azure Data Factory als Azure Synapse Pipelines. Dit artikel is van toepassing op toewijzingsgegevensstromen. Als u geen ervaring hebt met transformaties, raadpleegt u het inleidende artikel Gegevens transformeren met behulp van een toewijzingsgegevensstroom.
Met de sorteertransformatie kunt u de binnenkomende rijen in de huidige gegevensstroom sorteren. U kunt afzonderlijke kolommen kiezen en in oplopende of aflopende volgorde sorteren.
Notitie
Toewijzingsgegevensstromen worden uitgevoerd op Spark-clusters die gegevens verdelen over meerdere knooppunten en partities. Als u ervoor kiest om uw gegevens opnieuw te partitioneren in een volgende transformatie, verliest u mogelijk uw sortering als gevolg van het opnieuw toewijzen van gegevens. De beste manier om de sorteervolgorde in uw gegevensstroom te behouden, is door één partitie in te stellen op het tabblad Optimaliseren in de transformatie en de sorteertransformatie zo dicht mogelijk bij de Sink te houden.
Configuratie
Niet hoofdlettergevoelig: of u hoofdlettergevoelig wilt zijn bij het sorteren van tekenreeks- of tekstvelden
Alleen sorteren binnen partities: als gegevensstromen worden uitgevoerd op spark, wordt elke gegevensstroom onderverdeeld in partities. Met deze instelling worden gegevens alleen binnen de binnenkomende partities gesorteerd in plaats van de hele gegevensstroom te sorteren.
Sorteervoorwaarden: Kies op welke kolommen u sorteert en in welke volgorde de sortering plaatsvindt. De volgorde bepaalt de sorteerprioriteit. Kies of null-waarden wel of niet worden weergegeven aan het begin of einde van de gegevensstroom.
Berekende kolommen
Als u een kolomwaarde wilt wijzigen of extraheren voordat u de sortering toepast, beweegt u de muisaanwijzer over de kolom en selecteert u Berekende kolom. Hiermee opent u de opbouwfunctie voor expressies om een expressie te maken voor de sorteerbewerking in plaats van een kolomwaarde te gebruiken.
Script voor gegevensstroom
Syntaxis
<incomingStream>
sort(
desc(<sortColumn1>, { true | false }),
asc(<sortColumn2>, { true | false }),
...
) ~> <sortTransformationName<>
Opmerking
Het gegevensstroomscript voor de bovenstaande sorteerconfiguratie bevindt zich in het onderstaande codefragment.
BasketballStats sort(desc(PTS, true),
asc(Age, true)) ~> Sort1
Gerelateerde inhoud
Na het sorteren kunt u de statistische transformatie gebruiken