Schema afdwingen
Azure Databricks valideert de gegevenskwaliteit door schema op schrijven af te dwingen.
Notitie
In dit artikel wordt het standaardgedrag voor tables in Azure Databricks beschreven, dat wordt ondersteund door Delta Lake. Schema handhaving is niet van toepassing op tables die ondersteund worden door externe gegevens.
Schema afdwingen voor insert bewerkingen
Azure Databricks dwingt de volgende regels af bij het invoegen van gegevens in een table:
- Alle ingevoegde columns moeten aanwezig zijn in de doel-table.
- Alle column gegevenstypen moeten overeenkomen met de column gegevenstypen in de doel-table.
Notitie
Azure Databricks probeert column gegevenstypen veilig te casten zodat deze overeenkomen met de doel-table.
Schema-validatie tijdens MERGE
-bewerkingen
Azure Databricks dwingt de volgende regels af bij het invoegen of bijwerken van gegevens als onderdeel van een MERGE
bewerking:
- Als het gegevenstype in de broninstructie niet overeenkomt met het doel column, probeert
MERGE
column gegevenstypen veilig te casten zodat deze overeenkomen met het doel table. - De columns die het doel zijn van een
UPDATE
- ofINSERT
-actie, moeten aanwezig zijn in de doeltable. - Wanneer u
INSERT *
ofUPDATE SET *
syntaxis gebruikt:- Columns in de brongegevensset die niet aanwezig is in het doel table worden genegeerd.
- De brongegevensset moet alle columns bevatten die in de doelgegevensset tableaanwezig zijn.
Een tableschema wijzigen
U kunt de schema van een tableupdate met behulp van expliciete ALTER TABLE
instructies of automatische schema evolutie. Zie Update Delta Lake tableschema.
Schema evolutie heeft speciale semantiek voor MERGE
bewerkingen. Zie Automatische schema evolutie voor Delta Lake samenvoeging.