Konvertera till Delta Lake
CONVERT TO DELTA
SQL-kommandot utför en engångskonvertering för Parquet- och Iceberg-tabeller till Delta Lake-tabeller. För inkrementell konvertering av parquet- eller isbergstabeller till Delta Lake, se Stegvis klona Parquet- och Isbergstabeller till Delta Lake.
Unity Catalog stöder CONVERT TO DELTA
SQL-kommandot för Parquet- och Iceberg-tabeller som lagras på externa platser som hanteras av Unity Catalog.
Du kan konfigurera befintliga Parquet-datafiler som externa tabeller i Unity Catalog och sedan konvertera dem till Delta Lake för att låsa upp alla funktioner i Databricks lakehouse.
Den tekniska dokumentationen finns i KONVERTERA TILL DELTA.
Konvertera en katalog med Parquet- eller Iceberg-filer på en extern plats till Delta Lake
Kommentar
- Konvertering av isbergstabeller finns i offentlig förhandsversion.
- Konvertering av isbergstabeller stöds i Databricks Runtime 10.4 LTS och senare.
- Det går inte att konvertera iceberg-metaarkivtabeller.
- Det går inte att konvertera isbergstabeller som har upplevt partitionsutveckling .
- Det går inte att konvertera Iceberg-sammanslagningstabeller som har upplevt uppdateringar, borttagningar eller sammanslagningar.
- Följande är begränsningar för att konvertera Isbergstabeller med partitioner som definierats för trunkerade kolumner:
- I Databricks Runtime 12.2 LTS och nedan är
string
den enda trunkerade kolumntypen som stöds . - I Databricks Runtime 13.3 LTS och senare kan du arbeta med trunkerade kolumner av typer
string
,long
ellerint
. - Azure Databricks stöder inte arbete med trunkerade kolumner av typen
decimal
.
- I Databricks Runtime 12.2 LTS och nedan är
Du kan konvertera en katalog med Parquet-datafiler till en Delta Lake-tabell så länge du har skrivåtkomst på lagringsplatsen. Information om hur du konfigurerar åtkomst med Unity Catalog finns i Ansluta till molnobjektlagring och -tjänster med Unity Catalog.
Kommentar
Unity Catalog kräver Azure Data Lake Storage Gen2.
CONVERT TO DELTA parquet.`abfss://container@storageAccount.dfs.core.windows.net/parquet-data`;
CONVERT TO DELTA iceberg.`abfss://container@storageAccount.dfs.core.windows.net/iceberg-data`;
Om du vill läsa in konverterade tabeller som externa tabeller till Unity Catalog behöver du behörigheten CREATE EXTERNAL TABLE
på den externa platsen.
Kommentar
För Databricks Runtime 11.3 LTS och senare härleder CONVERT TO DELTA
automatiskt partitioneringsinformation för tabeller som är registrerade i Hive-metaarkivet. Du måste ange partitioneringsinformation för externa Unity Catalog-tabeller.
Konvertera hanterade och externa tabeller till Delta Lake i Unity Catalog
CONVERT TO DELTA
syntax kan endast användas för att skapa externa Unity Catalog-tabeller. Använd en CTAS
instruktion för att konvertera en äldre Hive-metaarkivhanterad Parquet-tabell direkt till en hanterad Delta Lake-tabell i Unity Catalog. Mer information finns i Uppgradera en Hive-tabell till en hanterad Unity Catalog-tabell med CREATE TABLE AS SELECT.
Information om hur du uppgraderar en extern Parquet-tabell till en extern Unity Catalog-tabell finns i Uppgradera en enda Hive-tabell till en extern Unity Catalog-tabell med hjälp av uppgraderingsguiden.
När du har registrerat en extern Parquet-tabell till Unity Catalog kan du konvertera den till en extern Delta Lake-tabell. Du måste ange partitioneringsinformation om Parquet-tabellen är partitionerad.
CONVERT TO DELTA catalog_name.database_name.table_name;
CONVERT TO DELTA catalog_name.database_name.table_name PARTITIONED BY (date_updated DATE);