Podpora variant v Delta Lake
Důležité
Tato funkce je ve verzi Public Preview.
Datový typ můžete použít VARIANT
k ukládání částečně strukturovaných dat v Delta Lake. Příklady práce s daty VARIANT
variant najdete v tématu Dotazování na data variant.
Databricks Runtime 15.3 nebo vyšší musíte použít ke čtení a zápisu tabulek s povolenou podporou varianty.
Povolení varianty v tabulce Delta
Pokud chcete povolit variantu, vytvořte novou tabulku se sloupcem typu VARIANT
, například:
CREATE TABLE table_name (variant_column VARIANT)
Podporu pro VARIANT
v existující tabulce můžete povolit také pomocí následující syntaxe:
ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')
Upozorňující
Když povolíte variantu, protokol tabulky se upgraduje. Po upgradu nebudou moct tabulka číst klienti Delta Lake, kteří variantu nepodporují. Viz Jak Azure Databricks spravuje kompatibilitu funkcí Delta Lake?.
Omezení
Jsou to následující omezení:
- K rozdělení tabulky nelze použít variantní sloupce.
- Variantní sloupec nemůže být klíč clusteringu pro tabulku.
- U klauzulí
GROUP BY
neboORDER BY
nelze použít variantní sloupce. - Ve sloupci variant nelze volat
DISTINCT
. - Nelze použít operátory sady SQL (
INTERSECT
,UNION
,EXCEPT
) s variantami sloupců. - Generování sloupců nelze použít k vytvoření sloupce varianty.
- Delta neshromažďuje
minValues
animaxValues
statistiky pro variantní sloupce.