將數據遷移至 Delta Lake
Azure Databricks 提供工具來簡化 Parquet 和 Iceberg 數據的移轉至 Delta Lake。
使用 CONVERT TO DELTA
時機與 CLONE
CONVERT TO DELTA
SQL 命令會執行一次性、就地將 Parquet 和 Iceberg 數據表轉換成外部數據表。 請參閱 轉換成 Delta Lake。
CLONE
Parquet 和 Iceberg 的支援可 CONVERT TO DELTA
擴充功能,以包含轉換的累加支援。 您可以使用 DEEP CLONE
來建立 Unity 目錄受控數據表。 請參閱 以累加方式將 Parquet 和 Iceberg 數據表複製到 Delta Lake。
Databricks 建議使用 Unity 目錄受控數據表來儲存數據,但就地轉換提供許多相同的優點,而不需要完全重寫所有數據。 Databricks 建議在移轉期間來源系統繼續接收更新時使用 CLONE
。