Převod na Delta Lake
Příkaz CONVERT TO DELTA
SQL provede jednorázový převod tabulek Parquet a Iceberg na tabulky Delta Lake. Přírůstkové převody tabulek Parquet nebo Iceberg na Delta Lake najdete v tématu Přírůstkové klonování tabulek Parquet a Iceberg do Delta Lake.
Katalog Unity podporuje CONVERT TO DELTA
příkaz SQL pro tabulky Parquet a Iceberg uložené v externích umístěních spravovaných katalogem Unity.
Existující datové soubory Parquet můžete nakonfigurovat jako externí tabulky v katalogu Unity a pak je převést na Delta Lake, abyste odemkli všechny funkce Databricks Lakehouse.
Technická dokumentace najdete v tématu CONVERT TO DELTA.
Převod adresáře souborů Parquet nebo Iceberg v externím umístění na Delta Lake
Poznámka:
- Převod tabulek Iceberg je ve verzi Public Preview.
- Převod tabulek Iceberg je podporován v Databricks Runtime 10.4 LTS a vyšší.
- Převod tabulek metastoru Iceberg není podporován.
- Převod tabulek Iceberg, u kterých došlo k vývoji oddílů, se nepodporuje.
- Převod tabulek při čtení, které obsahují aktualizace, odstranění nebo sloučení, se nepodporuje.
- Následující omezení platí pro převod tabulek Iceberg s oddíly definovanými ve zkrácených sloupcích:
- V Databricks Runtime 12.2 LTS a níže je podporován
string
pouze zkrácený typ sloupce . - Ve službě Databricks Runtime 13.3 LTS a vyšší můžete pracovat se zkrácenými sloupci typů
string
,long
neboint
. - Azure Databricks nepodporuje práci se zkrácenými sloupci typu
decimal
.
- V Databricks Runtime 12.2 LTS a níže je podporován
Adresář datových souborů Parquet můžete převést na tabulku Delta Lake, pokud máte přístup k zápisu do umístění úložiště. Informace o konfiguraci přístupu pomocí katalogu Unity najdete v tématu Připojení ke cloudovému úložišti objektů a službám pomocí katalogu Unity.
Poznámka:
Katalog Unity vyžaduje Azure Data Lake Storage Gen2.
CONVERT TO DELTA parquet.`abfss://container@storageAccount.dfs.core.windows.net/parquet-data`;
CONVERT TO DELTA iceberg.`abfss://container@storageAccount.dfs.core.windows.net/iceberg-data`;
Pokud chcete načíst převedené tabulky jako externí tabulky do katalogu Unity, potřebujete CREATE EXTERNAL TABLE
oprávnění k externímu umístění.
Poznámka:
Pro Databricks Runtime 11.3 LTS a novější CONVERT TO DELTA
automaticky odvodí informace o dělení tabulek registrovaných do metastoru Hive. Je nutné zadat informace o dělení externích tabulek katalogu Unity.
Převod spravovaných a externích tabulek na Delta Lake v katalogu Unity
CONVERT TO DELTA
Syntaxi lze použít pouze pro vytváření externích tabulek Katalogu Unity. CTAS
Pomocí příkazu převeďte starší spravovanou tabulku Metastore Hive Parquet přímo na spravovanou tabulku Delta Lake katalogu Unity. Viz Upgrade tabulky Hive na spravovanou tabulku Katalogu Unity pomocí příkazu CREATE TABLE AS SELECT.
Pokud chcete upgradovat externí tabulku Parquet na externí tabulku katalogu Unity, přečtěte si téma Upgrade jedné tabulky Hive na externí tabulku Katalogu Unity pomocí průvodce upgradem.
Po registraci externí tabulky Parquet do katalogu Unity ji můžete převést na externí tabulku Delta Lake. Pokud je tabulka Parquet rozdělená na oddíly, musíte zadat informace o dělení.
CONVERT TO DELTA catalog_name.database_name.table_name;
CONVERT TO DELTA catalog_name.database_name.table_name PARTITIONED BY (date_updated DATE);