Azure Data Factory での変換の種類について説明する

完了

マッピング データ フローには、データを変更するためのさまざまな変換の種類が用意されています。 それらは次のカテゴリに分類されます。

カテゴリ名 説明
スキーマ修飾子変換 これらの種類の変換では、変換のアクションに基づいて新しい列を作成することによって、シンクのターゲットを変更します。 たとえば、派生列変換では、既存の列に対して実行される操作に基づいて、新しい列が作成されます。
行修飾子変換 これらの種類の変換は、変換先での行の表示方法に影響します。 たとえば、並べ替え変換では、データが並べ替えられます。
複数入力、出力変換 これらの種類の変換では、新しいデータ パイプラインを生成するか、複数のパイプラインを 1 つにマージします。 たとえば、結合変換では、複数のデータ ストリームが結合されます。

以下は、マッピング データ フローで使用可能な変換の一覧です

名前 カテゴリ 説明
集計 スキーマ修飾子 既存の列または計算列によってグループ化される、SUM、MIN、MAX、COUNT などのさまざまな種類の集計を定義できます。
行の変更 行の修飾子 行に対して、挿入、削除、更新および upsert の各ポリシーを設定します。 一対多の条件を式として追加できます。 各行は一致する最初の式に対応したポリシーでマークされるので、これらの条件は優先度の順に指定する必要があります。 これらの条件によってそれぞれ、行が挿入、更新、削除、アップサートされます。 行の変更では、ご利用のデータベースに対して DDL と DML の両方を生成できます。
条件分割 複数の入力/出力 一致条件に基づいて、データの行を異なるストリームにルートします。
派生列 スキーマ修飾子 データ フローの言語を使用して、新しい列を生成するか、既存のフィールドを変更します。
Exists 複数の入力/出力 お使いのデータが別のソースまたはストリームに存在するかどうかを確認します。
Assert 行の修飾子 条件に基づいて、行をフィルターします。
フラット化 スキーマ修飾子 JSON などの階層構造体の中で配列値を取得し、それらを個々の行に展開します。
Join 複数の入力/出力 2 つのソースまたはストリームのデータを結合します。
Lookup 複数の入力/出力 もう一方のソースのデータを参照できるようにします。
新しいブランチ 複数の入力/出力 同じデータ ストリームに対して複数の操作と変換を行います。
ピボット スキーマ修飾子 1 つまたは複数のグループ化列に、個別の列に変換された個々の行の値がある集計。
Select スキーマ修飾子 列とストリームの名前をエイリアス化し、列を削除するか、並べ替えます。
Sink - データの最終受信先。
Sort 行の修飾子 現在のデータ ストリームの受信行を並べ替えます。
ソース - データ フローのデータ ソース。
代理キー スキーマ修飾子 インクリメントする非ビジネスの任意のキー値を追加します。
Union (結合) 複数の入力/出力 複数のデータ ストリームを垂直方向に結合します。
ピボット解除 スキーマ修飾子 列を行の値にピボットします。
ウィンドウ スキーマ修飾子 データ ストリーム内の列のウィンドウベースの集計を定義します。

データ フローの式ビルダー

定義できる変換の一部では、データ フローの式ビルダーを使用できます。式ビルダーでは、データ フローの列、フィールド、変数、パラメーター、関数をそれらのボックスで使用して、変換の機能をカスタマイズできます。

式を作成するには、式ビルダーを使用します。式ビルダーは、変換内の式テキスト ボックスをクリックすると起動します。 変換の列を選択したときに、[計算列] のオプションが表示されることもあります。 このオプションをクリックすると、起動した式ビルダーも表示されます。

Using the expression builder in the Mapping Data Flow

式ビルダー ツールでは、テキスト エディター オプションが既定で設定されています。 オートコンプリート機能では、Azure Data Factory Data Flow オブジェクト モデル全体から読み取り、構文チェックと強調表示を行います。