Prise en charge des variantes dans Delta Lake
Important
Cette fonctionnalité est disponible en préversion publique.
Vous pouvez utiliser le VARIANT
type de données pour stocker des données semi-structurées dans Delta Lake. Pour obtenir des exemples sur l’utilisation de VARIANT
, consultez les données de variante de requête.
Vous devez utiliser Databricks Runtime 15.3 ou une version ultérieure pour lire et écrire des tables avec la prise en charge des variantes activée.
Activer la variante sur une table Delta
Pour activer la variante, créez une table avec une VARIANT
colonne de type, par exemple :
CREATE TABLE table_name (variant_column VARIANT)
Vous pouvez également activer la prise en charge pour VARIANT
sur une table existante à l’aide de la syntaxe suivante :
ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')
Avertissement
Lorsque vous activez la variante, le protocole de table est mis à niveau. Après la mise à niveau, la table ne sera pas lisible par les clients Delta Lake qui ne prennent pas en charge la variante. Consultez Comment Azure Databricks gère-t-il la compatibilité des fonctionnalités Delta Lake ?.
Limites
Les limites suivantes existent :
- Vous ne pouvez pas utiliser de colonnes de variante pour partitionner une table.
- Une colonne de variante ne peut pas être une clé de clustering pour une table.
- Vous ne pouvez pas utiliser la génération de colonnes pour créer une colonne de variante.
- Delta ne collecte pas
minValues
oumaxValues
les statistiques pour les colonnes de variantes.