Delta Lake にデータを移行する
Azure Databricks には、Parquet および アイス データの Delta Lake への移行を簡略化するためのツールが用意されています。
CONVERT TO DELTA
と CLONE
を使い分けるタイミング
CONVERT TO DELTA
SQL コマンドを実行すると、Parquet テーブルと Iceberg テーブルを外部テーブルに 1 回限りでインプレース変換されます。 「Delta Lake に変換する」を参照してください。
CLONE
Parquet と アイス のサポートにより、CONVERT TO DELTA
機能が拡張され、変換の増分サポートが含まれます。 DEEP CLONE
を使用して Unity Catalog マネージド テーブルを作成できます。 「Parquet テーブルと Iceberg テーブルを Delta Lake に増分複製する」を参照してください。
Databricks は、Unity Catalog マネージド テーブルを使用してデータを格納することをお勧めします。ただし、インプレース変換はすべてのデータを完全に書き換えることなく、同じ利点の多くを実現します。 移行中にソース システムが引き続き更新プログラムを受信する場合、Databricks では CLONE
を使用することをお勧めします。