次の方法で共有


Dataflow Gen2 を使用して 2 GB のオンプレミス CSV データをレイクハウス テーブルに読み込む価格シナリオ

このシナリオでは、Dataflow Gen2 を使用して、2 GB のオンプレミス CSV データを Microsoft Fabric のレイクハウス テーブルに読み込みました。

以下の例で使用されている価格は架空のものであり、正確な実際の価格を暗示するものではありません。 これらは、Microsoft Fabric の Data Factory プロジェクトのコストを見積もり、計画、管理を行う方法を示すためのものにすぎません。 また、Fabric 容量はリージョン間で一意な価格が設定されているため、米国西部 2 (一般的な Azure リージョン) のファブリック容量の従量課金制の価格 (CU あたり 1 時間あたり 0.18 ドル) を使用します。 その他の Fabric 容量の価格オプションについては、Microsoft Fabric の価格を参照してください。

構成

このシナリオを実現するには、次の手順でデータフローを作成する必要があります。

  1. データフローの初期化: まず、オンプレミス環境からデータフローに 2 GB の CSV ファイルをアップロードします。
  2. Power Query を構成する:
    1. Power Query に移動します。
    2. クエリをステージングするためのオプションを無効にします。
    3. CSV ファイルの結合に進みます。
  3. データの変換:
    1. わかりやすくするためにヘッダーを昇格します。
    2. 不要な列を削除します。
    3. 必要に応じて列のデータ型を調整します。
  4. 出力データ変換先を定義する:
    1. データ出力先としてレイクハウスを構成します。
    2. この例では、Fabric 内のレイクハウスが作成され、使用されています。

Fabric メトリック アプリを使用したコスト見積もり

Fabric メトリック アプリでのジョブの実行時間と CU 消費量を示すスクリーンショット。

データフロー Gen2 の更新コストの詳細を示すスクリーンショット。

実行に使用された Dataflow Gen2 ハイスケール データフロー コンピューティング使用量の詳細を示すスクリーンショット。

実行に使用された2 番目の Dataflow Gen2 高スケールのデータフロー コンピューティング使用量の詳細を示すスクリーンショット。

Dataflow Gen2 更新操作では 4749.42 CU 秒が消費され、2 つのハイスケール データフロー コンピューティング操作でそれぞれ 7.78 CU 秒 + 7.85 CU 秒が消費されました。

Note

メトリックとして報告されますが、実際の実行時間は、Fabric Metrics アプリで有効な CU 時間を計算する場合には関係ありません。これは、同じく報告される CU 秒のメトリックが実行時間についても既に説明しているためです。

メトリック コンピューティング従量課金
Dataflow Gen2 更新 CU 秒 4749.42 CU 秒
ハイスケール データフロー コンピューティング CU 秒 (7.78 + 7.85) 15.63 CU 秒
請求対象の有効 CU 時間 (4749.42 + 15.63) / (60*60) = 1.32 CU 時間

合計実行コストは $0.18/CU 時間 = (1.32 CU 時間) * ($0.18/CU 時間) ~= $0.24