次の方法で共有


Dataflow Gen2 を使用して 2 GB のオンプレミス CSV データをレイクハウス テーブルに読み込む価格シナリオ

このシナリオでは、Dataflow Gen2 を使用して、2 GB のオンプレミス CSV データを Microsoft Fabric のレイクハウス テーブルに読み込みました。

以下の例で使用されている価格は架空のものであり、正確な実際の価格を暗示するものではありません。 これらは、Microsoft Fabric の Data Factory プロジェクトのコストを見積もり、計画、管理を行う方法を示すためのものにすぎません。 また、Fabric 容量はリージョン間で一意な価格が設定されているため、米国西部 2 (一般的な Azure リージョン) のファブリック容量の従量課金制の価格 (CU あたり 1 時間あたり 0.18 ドル) を使用します。 その他の Fabric 容量の価格オプションについては、Microsoft Fabric の価格を参照してください。

構成

このシナリオを実現するには、次の手順でデータフローを作成する必要があります。

  1. データフローの初期化: まず、オンプレミス環境からデータフローに 2 GB の CSV ファイルをアップロードします。
  2. Power Query を構成する:
    1. Power Query に移動します。
    2. クエリをステージングするためのオプションを無効にします。
    3. CSV ファイルの結合に進みます。
  3. データの変換:
    1. わかりやすくするためにヘッダーを昇格します。
    2. 不要な列を削除します。
    3. 必要に応じて列のデータ型を調整します。
  4. 出力データ変換先を定義する:
    1. データ出力先としてレイクハウスを構成します。
    2. この例では、Fabric 内のレイクハウスが作成され、使用されています。

Fabric メトリック アプリを使用したコスト見積もり

Screenshot showing the duration and CU consumption of the job in the Fabric Metrics App.

Screenshot showing details of the Dataflow Gen2 Refresh cost

Screenshot showing details of a Dataflow Gen2 High Scale Dataflow Compute consumption used in the run.

Screenshot showing details of a second Dataflow Gen2 High Scale Dataflow Compute consumption used in the run.

Dataflow Gen2 更新操作では 4749.42 CU 秒が消費され、2 つのハイスケール データフロー コンピューティング操作でそれぞれ 7.78 CU 秒 + 7.85 CU 秒が消費されました。

Note

メトリックとして報告されますが、実際の実行時間は、Fabric Metrics アプリで有効な CU 時間を計算する場合には関係ありません。これは、同じく報告される CU 秒のメトリックが実行時間についても既に説明しているためです。

メトリック コンピューティング従量課金
Dataflow Gen2 更新 CU 秒 4749.42 CU 秒
ハイスケール データフロー コンピューティング CU 秒 (7.78 + 7.85) 15.63 CU 秒
請求対象の有効 CU 時間 (4749.42 + 15.63) / (60*60) = 1.32 CU 時間

合計実行コストは $0.18/CU 時間 = (1.32 CU 時間) * ($0.18/CU 時間) ~= $0.24