Dataflow Gen2 を使用して 2 GB のオンプレミス CSV データをレイクハウス テーブルに読み込む価格シナリオ
このシナリオでは、Dataflow Gen2 を使用して、2 GB のオンプレミス CSV データを Microsoft Fabric のレイクハウス テーブルに読み込みました。
以下の例で使用されている価格は架空のものであり、正確な実際の価格を暗示するものではありません。 これらは、Microsoft Fabric の Data Factory プロジェクトのコストを見積もり、計画、管理を行う方法を示すためのものにすぎません。 また、Fabric 容量はリージョン間で一意な価格が設定されているため、米国西部 2 (一般的な Azure リージョン) のファブリック容量の従量課金制の価格 (CU あたり 1 時間あたり 0.18 ドル) を使用します。 その他の Fabric 容量の価格オプションについては、Microsoft Fabric の価格を参照してください。
構成
このシナリオを実現するには、次の手順でデータフローを作成する必要があります。
- データフローの初期化: まず、オンプレミス環境からデータフローに 2 GB の CSV ファイルをアップロードします。
- Power Query を構成する:
- Power Query に移動します。
- クエリをステージングするためのオプションを無効にします。
- CSV ファイルの結合に進みます。
- データの変換:
- わかりやすくするためにヘッダーを昇格します。
- 不要な列を削除します。
- 必要に応じて列のデータ型を調整します。
- 出力データ変換先を定義する:
- データ出力先としてレイクハウスを構成します。
- この例では、Fabric 内のレイクハウスが作成され、使用されています。
Fabric メトリック アプリを使用したコスト見積もり
Dataflow Gen2 更新操作では 4749.42 CU 秒が消費され、2 つのハイスケール データフロー コンピューティング操作でそれぞれ 7.78 CU 秒 + 7.85 CU 秒が消費されました。
Note
メトリックとして報告されますが、実際の実行時間は、Fabric Metrics アプリで有効な CU 時間を計算する場合には関係ありません。これは、同じく報告される CU 秒のメトリックが実行時間についても既に説明しているためです。
メトリック | コンピューティング従量課金 |
---|---|
Dataflow Gen2 更新 CU 秒 | 4749.42 CU 秒 |
ハイスケール データフロー コンピューティング CU 秒 | (7.78 + 7.85) 15.63 CU 秒 |
請求対象の有効 CU 時間 | (4749.42 + 15.63) / (60*60) = 1.32 CU 時間 |
合計実行コストは $0.18/CU 時間 = (1.32 CU 時間) * ($0.18/CU 時間) ~= $0.24