Microsoft Fabric のデータフロー Gen2 について詳しく確認する
Microsoft Fabric では、Data Factory ワークロードまたは Power BI ワークスペースにデータフロー Gen2 を作成するか、レイクハウスで直接作成できます。 このシナリオはデータ インジェストに重点を置いているので、Data Factory ワークロード エクスペリエンスを見てみましょう。 データフロー Gen2 では、Power Query Online を使用して変換を視覚化します。 インターフェイスの概要を次に示します。
1. Power Query リボン
さまざまなデータ ソース コネクタがデータフロー Gen2 でサポートされています。 一般的なソースには、クラウドとオンプレミスのリレーショナル データベース、Excel ファイルやフラット ファイル、SharePoint、SalesForce、Spark、Fabric レイクハウスがあります。 その後、次のような多数のデータ変換が可能になります。
- 行のフィルター処理と並べ替え
- ピボットとピボット解除
- クエリのマージと追加
- 分割と条件付き分割
- 値の置換と重複の削除
- 列の追加、名前変更、並べ替え、または削除
- 順位とパーセンテージの計算ツール
- 上位 N 位と下位 N 位を選択する
このリボンで、データ ソース接続の作成と管理、パラメーターの管理、既定のデータ宛先の構成も行うことができます。
2. クエリ ペイン
クエリ ペインには、さまざまなデータ ソース ("クエリ" と呼ばれるようになりました) が表示されます。 これらのクエリは、データ ストアに読み込まれると、テーブルと呼ばれます。 スター スキーマの作成や別個の小さなテーブルへのデータの分割などで、同じデータの複数のコピーが必要な場合は、クエリを複製または参照できます。 1 回インポートすることのみが必要な場合には、クエリの読み込みを無効にすることもできます。
3. ダイアグラム ビュー
ダイアグラム ビューを使用すると、どのようにデータ ソースが接続され、さまざまな変換が適用されているかを視覚的に確認できます。 たとえば、データフローがデータ ソースに接続し、クエリを複製し、ソース クエリから列を削除してから、複製のクエリのピボットを解除するとします。 各クエリは、適用されたすべての変換を含む図形として表され、複製のクエリと線で接続されます。 このビューのオンとオフは切り替えることができます。
4. データ プレビュー ペイン
データ プレビュー ペインには、データのサブセットのみが表示され、どの変換を行う必要があるか、それがデータにどのように作用するかを確認できます。 また、プレビュー ペインでの操作として、列をドラッグ アンド ドロップして順序を変更したり、列を右クリックしてフィルター処理や変更を行ったりすることもできます。 データ プレビューには、選択したクエリのすべての変換が表示されます。
5. クエリの設定ペイン
[クエリの設定] ペインには、[適用したステップ] が表示されます。 各変換はステップとして表され、その一部は、データ ソースを接続するときに自動的に適用されます。 変換の複雑さに応じて、各クエリに複数の手順が適用される場合があります。 ほとんどのステップには、ステップを変更できる歯車アイコンがあります。ない場合は、変換を削除して再度適用する必要があります。
各ステップには、ステップの名前の変更、並べ替え、削除を行うことができるように、右クリックしたときのコンテキスト メニューもあります。 クエリ フォールディングをサポートするデータ ソースに接続するときに、データ ソース クエリを表示することもできます。
このビジュアル インターフェイスは便利ですが、詳細エディターを使用して M コードを表示することもできます。
[クエリの設定] ペインには、Fabric 環境の次のいずれかの場所にデータを配置できる [Data Destination] (データ宛先) オプションが表示されます。
- レイクハウス
- 倉庫
- SQL データベース
Azure SQL データベース、Azure Data Explorer、または Azure Synapse Analytics にデータフローを読み込むこともできます。
データフロー Gen2 は、Fabric データ ストアにデータを取り込み、変換し、読み込むためのロー コードまたはノー コードのソリューションを提供します。 Power BI 開発者は使い慣れているため、上流での変換の実行をすぐに開始して、レポートのパフォーマンスを向上させることができます。
Note
詳細については、Power Query のドキュメントを参照して、データフローを最適化してください。