Delta Lake-tabellen verrijken met aangepaste metagegevens
Databricks raadt aan altijd opmerkingen voor tabellen en kolommen in tabellen op te geven. U kunt deze opmerkingen genereren met BEHULP van AI. Zie DOOR AI gegenereerde opmerkingen toevoegen aan Unity Catalog-objecten.
Unity Catalog biedt ook de mogelijkheid om gegevens te taggen. Zie Tags toepassen op beveiligbare objecten van Unity Catalog.
U kunt ook berichten vastleggen voor afzonderlijke doorvoeringen naar tabellen in een veld in het Delta Lake-transactielogboek.
Door de gebruiker gedefinieerde doorvoermetagegevens instellen
U kunt door de gebruiker gedefinieerde tekenreeksen opgeven als metagegevens in doorvoeringen, met behulp van de optie userMetadata
DataFrameWriter of de SparkSession-configuratie spark.databricks.delta.commitInfo.userMetadata
. Als beide zijn opgegeven, heeft de optie voorkeur. Deze door de gebruiker gedefinieerde metagegevens kunnen worden gelezen in de DESCRIBE HISTORY
bewerking. Zie Werken met Delta Lake-tabelgeschiedenis.
SQL
SET spark.databricks.delta.commitInfo.userMetadata=some-comment
INSERT OVERWRITE target_table SELECT * FROM data_source
Python
df.write \
.mode("overwrite") \
.option("userMetadata", "some-comment") \
.table("target_table")
Scala
df.write
.mode("overwrite")
.option("userMetadata", "some-comment")
.table("target_table")