對應資料流中的排序轉換
適用於:Azure Data Factory Azure Synapse Analytics
提示
試用 Microsoft Fabric 中的 Data Factory,這是適用於企業的全方位分析解決方案。 Microsoft Fabric 涵蓋從資料移動到資料科學、即時分析、商業智慧和報告的所有項目。 了解如何免費開始新的試用 (部分機器翻譯)!
Azure Data Factory 和 Azure Synapse Pipelines 中均可使用資料流。 本文適用於對應資料流。 若您不熟悉轉換作業,請參閱簡介文章使用對應資料流轉換資料。
排序轉換可讓您排序目前資料流的內送資料列。 您可以選擇個別資料行,並以遞增或遞減順序排序。
注意
對應資料流會在 Spark 叢集上執行,將資料分散到多個節點和分割區。 如果您選擇在後續的轉換中重新分割您的資料,您可能會由於重新輪換資料而失去資料排序。 維護資料流程中排序順序的最佳方式,是在轉換的 [最佳化] 索引標籤中設定單一分割區,並讓「排序」轉換盡可能接近「接收」。
組態
不區分大小寫:不論您在排序字串或文字欄位時是否要忽略大小寫
只在分割區內排序:當資料流程在 Spark 上執行時,每個資料流會分成不同的分割區。 此設定只會在傳入的分割區內排序資料,而不會排序整個資料流。
排序條件:選擇資料行的排序依據及排序的發生順序。 此順序會決定排序優先順序。 選擇是否要在資料流的開頭或結尾顯示 Null。
計算資料行
若要在套用排序之前修改或擷取資料行值,請將滑鼠停留在資料行上,然後選取 [計算資料行]。 這會開啟運算式產生器,以建立排序作業的運算式,而不是使用資料行值。
資料流程指令碼
語法
<incomingStream>
sort(
desc(<sortColumn1>, { true | false }),
asc(<sortColumn2>, { true | false }),
...
) ~> <sortTransformationName<>
範例
上述排序設定的資料流程指令碼位於下列程式碼片段中。
BasketballStats sort(desc(PTS, true),
asc(Age, true)) ~> Sort1
相關內容
排序之後,您可能想要使用彙總轉換