使用 describe detail 查看 Delta Lake 表详细信息

可以使用 DESCRIBE DETAIL检索有关 Delta 表的详细信息(例如文件数、数据大小)。

DESCRIBE DETAIL '/data/events/'

DESCRIBE DETAIL eventsTable

有关 Spark SQL 语法详细信息,请参阅 DESCRIBE DETAIL

有关 Scala/Java/Python 语法详细信息,请参阅 Delta Lake API 文档

细节架构

此操作的输出只有一行,并具有以下模式。

注意

看到的列取决于所使用的 Databricks Runtime 版本以及已启用的表功能。

类型 描述
格式 字符串 表的格式,即 delta
id 字符串 表的唯一 ID。
名字 字符串 在元存储中定义的表名称。
description 字符串 表的说明。
location 字符串 表的位置。
createdAt timestamp 表创建时间。
lastModified timestamp 表格最后修改的时间。
partitionColumns 字符串数组 如果表已分区,则为分区列的名称。
numFiles long 表最新版本中的文件数。
sizeInBytes int 表的最新快照的大小(以字节为单位)。
properties string-string 映射 为此表设置的所有属性。
minReaderVersion int 可读取表的读取器的最低版本(根据日志协议)。
minWriterVersion int 可写入表的编写器(根据日志协议)的最低版本。
统计学 使用字符串键映射 其他表级统计信息。
tableFeatures 字符串数组 表支持的表功能列表。 请参阅 Azure Databricks 如何管理 Delta Lake 功能兼容性?
clusteringColumns 字符串数组 用于 Liquid 聚类分析的列。 请参阅将 liquid 聚类分析用于 Delta 表

下面是输出外观的示例:

+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+
|format|                  id|              name|description|            location|           createdAt|       lastModified|partitionColumns|numFiles|sizeInBytes|properties|minReaderVersion|minWriterVersion|
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+
| delta|d31f82d2-a69f-42e...|default.deltatable|       null|file:/Users/tuor/...|2020-06-05 12:20:...|2020-06-05 12:20:20|              []|      10|      12345|        []|               1|               2|
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+