Migrieren von Daten in Delta Lake
Azure Databricks bietet Tools zur Vereinfachung der Migration von Parquet- und Eisberg-Daten in den Delta Lake.
Verwendung von CONVERT TO DELTA
vs. CLONE
Der SQL-Befehl CONVERT TO DELTA
führt eine einmalige direkte Konvertierung von Parquet- und Iceberg-Tabellen in externe Tabellen durch. Weitere Informationen finden Sie unter Konvertieren in Delta Lake.
CLONE
-Unterstützung für Parquet und Eisberg erweitert die CONVERT TO DELTA
-Funktionalität um inkrementelle Unterstützung für die Konvertierung. Sie können DEEP CLONE
verwenden, um mit Unity Catalog verwaltete Tabellen zu erstellen. Siehe Inkrementelles Klonen von Parquet- und Iceberg-Tabellen zu Delta Lake.
Databricks empfiehlt das Speichern von Daten mithilfe von verwalteten Tabellen in Unity Catalog, die direkte Konvertierung bietet jedoch viele der gleichen Vorteile, ohne dass alle Daten vollständig neu geschrieben werden müssen. Databricks empfiehlt die Verwendung von CLONE
, wenn das Quellsystem während der Migration weiterhin Updates empfängt.