Обогащение таблиц Delta Lake с помощью пользовательских метаданных
Databricks рекомендует всегда предоставлять комментарии для таблиц и столбцов в таблицах. Эти комментарии можно создать с помощью ИИ. См. сведения о добавлении примечаний, созданных ИИ, в объекты каталога Unity.
Каталог Unity также предоставляет возможность тегировать данные. См. раздел "Применение тегов к защищаемым объектам каталога Unity".
Вы также можете регистрировать сообщения для отдельных фиксаций в таблицах в поле в журнале транзакций Delta Lake.
Настройка метаданных фиксации, определяемых пользователем
Определяемые пользователем строки можно указать как метаданные в фиксациях с помощью параметра userMetadata
DataFrameWriter или конфигурации spark.databricks.delta.commitInfo.userMetadata
SparkSession. Если указаны оба значения, параметр выбирает приоритетное значение. Эти пользовательские метаданные доступны для чтения в DESCRIBE HISTORY
операции. См. Работа с таблицей журнала Delta Lake.
SQL
SET spark.databricks.delta.commitInfo.userMetadata=some-comment
INSERT OVERWRITE target_table SELECT * FROM data_source
Python
df.write \
.mode("overwrite") \
.option("userMetadata", "some-comment") \
.table("target_table")
Scala
df.write
.mode("overwrite")
.option("userMetadata", "some-comment")
.table("target_table")