Delta Lake でのバリアント のサポート
重要
この機能はパブリック プレビュー段階にあります。
VARIANT
データ型を使用して、半構造化データを Delta Lake に格納できます。 VARIANT
の使用例については、「クエリ バリアント データ」を参照してください。
バリアント サポートが有効になっている tables の読み取りと書き込みには、Databricks Runtime 15.3 以降を使用する必要があります。
デルタ table でバリアントを有効にする
バリアント型を有効にするには、次のように、VARIANT
型 columnを持つ新しい table を作成します。
CREATE TABLE table_name (variant_column VARIANT)
次の構文を使用して、既存の table での VARIANT
のサポートを有効にすることもできます。
ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')
警告
バリアントを有効にすると、table プロトコルがアップグレードされます。 アップグレード後、バリアントをサポートしていない Delta Lake クライアントは、table を読み取りできなくなります。 「Azure Databricks で Delta Lake 機能の互換性を管理する方法は?」を参照してください。
制限事項
次の制限があります。
- バリアント columns から partition までの範囲で tableを使用することはできません。
- バリアント column は、tableのクラスタリング キーにすることはできません。
- バリアント columns は、
GROUP BY
句またはORDER BY
句と一緒に使用することはできません。 - バリアント columnに対して
DISTINCT
を呼び出すことはできません。 - SQL set 演算子 (
INTERSECT
,UNION
,EXCEPT
) は、バリアント型の columnsでは使用できません。 - column 生成を使用してバリアント columnを作成することはできません。
- デルタでは、バリアント columnsの
minValues
またはmaxValues
統計は収集されません。