共用方式為


對應資料流中的排序轉換

適用於:Azure Data Factory Azure Synapse Analytics

提示

試用 Microsoft Fabric 中的 Data Factory,這是適用於企業的全方位分析解決方案。 Microsoft Fabric 涵蓋從資料移動到資料科學、即時分析、商業智慧和報告的所有項目。 了解如何免費開始新的試用 (部分機器翻譯)!

Azure Data Factory 和 Azure Synapse Pipelines 中均可使用資料流。 本文適用於對應資料流。 若您不熟悉轉換作業,請參閱簡介文章使用對應資料流轉換資料

排序轉換可讓您排序目前資料流的內送資料列。 您可以選擇個別資料行,並以遞增或遞減順序排序。

注意

對應資料流會在 Spark 叢集上執行,將資料分散到多個節點和分割區。 如果您選擇在後續的轉換中重新分割您的資料,您可能會由於重新輪換資料而失去資料排序。 維護資料流程中排序順序的最佳方式,是在轉換的 [最佳化] 索引標籤中設定單一分割區,並讓「排序」轉換盡可能接近「接收」。

組態

排序設定

不區分大小寫:不論您在排序字串或文字欄位時是否要忽略大小寫

只在分割區內排序:當資料流程在 Spark 上執行時,每個資料流會分成不同的分割區。 此設定只會在傳入的分割區內排序資料,而不會排序整個資料流。

排序條件:選擇資料行的排序依據及排序的發生順序。 此順序會決定排序優先順序。 選擇是否要在資料流的開頭或結尾顯示 Null。

計算資料行

若要在套用排序之前修改或擷取資料行值,請將滑鼠停留在資料行上,然後選取 [計算資料行]。 這會開啟運算式產生器,以建立排序作業的運算式,而不是使用資料行值。

資料流程指令碼

語法

<incomingStream>
    sort(
        desc(<sortColumn1>, { true | false }),
        asc(<sortColumn2>, { true | false }),
        ...
    ) ~> <sortTransformationName<>

範例

排序設定

上述排序設定的資料流程指令碼位於下列程式碼片段中。

BasketballStats sort(desc(PTS, true),
    asc(Age, true)) ~> Sort1

排序之後,您可能想要使用彙總轉換