Application du schéma
Azure Databricks valide la qualité des données en appliquant le schéma lors de l’écriture.
Remarque
Cet article décrit le comportement par défaut des tables associées à Delta Lake sur Azure Databricks. L’application du schéma ne s’applique pas aux tables associées à des données externes.
Application du schéma pour les opérations d’insertion
Azure Databricks applique les règles suivantes lors de l’insertion de données dans une table :
- Toutes les colonnes insérées doivent exister dans la table cible.
- Tous les types de données de colonne doivent correspondre aux types de données de colonne de la table cible.
Remarque
Azure Databricks tente de caster en toute sécurité les types de données de colonne pour qu’ils correspondent à ceux de la table cible.
Validation du schéma pendant les opérations MERGE
Azure Databricks applique les règles suivantes lors de l’insertion ou de la mise à jour de données dans le cadre d’une opération MERGE
:
- Si le type de données de l’instruction source ne correspond pas à la colonne cible,
MERGE
tente de caster en toute sécurité les types de données de colonne pour qu’ils correspondent à ceux de la table cible. - Les colonnes qui sont la cible d’une action
UPDATE
ouINSERT
doivent exister dans la table cible. - Lorsque vous utilisez la syntaxe
INSERT *
ouUPDATE SET *
:- Les colonnes du jeu de données source non présentes dans la table cible sont ignorées.
- Toutes les colonnes du jeu de données source doivent être présentes dans la table cible.
Modifier le schéma d’une table
Vous pouvez mettre à jour le schéma d’une table en utilisant des instructions ALTER TABLE
explicites ou l’évolution automatique du schéma. Consultez Mettre à jour un schéma de table Delta Lake.
L’évolution du schéma a une sémantique spéciale pour les opérations MERGE
. Consultez Évolution automatique du schéma pour la fusion Delta Lake.