次の方法で共有


マッピング データ フローでの順位変換

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

企業向けのオールインワン分析ソリューション、Microsoft Fabric の Data Factory をお試しください。 Microsoft Fabric は、データ移動からデータ サイエンス、リアルタイム分析、ビジネス インテリジェンス、レポートまで、あらゆるものをカバーしています。 無料で新しい試用版を開始する方法について説明します。

データ フローは、Azure Data Factory および Azure Synapse Pipelines の両方で使用できます。 この記事は、マッピング データ フローに適用されます。 変換を初めて使用する場合は、概要の記事「マッピング データ フローを使用してデータを変換する」を参照してください。

順位変換を使用して、ユーザーが指定した並べ替え条件に基づいて順序付けされた順位を生成します。

構成

順位設定

大文字と小文字の区別をしない: 並べ替え列の型が文字列の場合、大文字と小文字の違いが順位付けで考慮されます。

高密度: 有効にすると、順位列は高密度で順位付けされます。 各順位カウントは連続した数値になり、順位値は相互に関連付けられた後にスキップされません。

順位列: 生成された順位列の名前。 この列は長整数型になります。

並べ替え条件: 並べ替えの基準となり、その列内で順序が並べ替えられる列を選択します。 順序によって並べ替えの優先順位が決まります。

上記の構成では、入力されたバスケットボール データを取得し、"pointsRanking" という順位列を作成します。 列 PTS の最大値を持つ行は、pointsRanking の値が 1 になります。

データ フローのスクリプト

構文

<incomingStream>
    rank(
        desc(<sortColumn1>),
        asc(<sortColumn2>),
        ...,
        caseInsensitive: { true | false }
        dense: { true | false }
        output(<rankColumn> as long)
    ) ~> <sortTransformationName<>

順位設定

次のコード スニペットには、上記の順位構成に対するデータ フロー スクリプトが含まれています。

PruneColumns
    rank(
        desc(PTS, true),
        caseInsensitive: false,
        output(pointsRanking as long),
        dense: false
    ) ~> RankByPoints

フィルター変換を使用して、順位の値に基づいて行をフィルター処理します。