使用描述詳細數據檢閱 Delta Lake 數據表詳細數據
您可以使用 擷取差異數據表的詳細資訊(例如檔案數目、數據大小)。DESCRIBE DETAIL
DESCRIBE DETAIL '/data/events/'
DESCRIBE DETAIL eventsTable
如需Spark SQL語法詳細數據,請參閱 DESCRIBE DETAIL。
如需 Scala/Java/Python 語法詳細數據,請參閱 Delta Lake API 檔。
詳細架構
此作業的輸出只有一個具有下列架構的數據列。
注意
您看到的數據行取決於您所使用的 Databricks Runtime 版本,以及您已啟用的數據表功能。
資料行 | 類型 | 描述 |
---|---|---|
format | 字串 | 資料表的格式, delta 也就是 。 |
id | 字串 | 數據表的唯一標識碼。 |
NAME | 字串 | 中繼存放區中所定義的數據表名稱。 |
description | 字串 | 數據表的描述。 |
location | 字串 | 數據表的位置。 |
createdAt | timestamp | 建立數據表時。 |
lastModified | timestamp | 上次修改數據表的時間。 |
partitionColumns | 字串陣列 | 如果分割數據表,則為數據分割數據行的名稱。 |
numFiles | long | 最新版數據表中的檔案數目。 |
sizeInBytes | int | 數據表最新快照集的大小,以位元組為單位。 |
內容 | string-string map | 為此數據表設定的所有屬性。 |
minReaderVersion | int | 可讀取數據表的讀取器版本下限(根據記錄通訊協定)。 |
minWriterVersion | int | 寫入器的最低版本(根據記錄通訊協定)可以寫入數據表。 |
統計資料 | 使用字串索引鍵對應 | 其他數據表層級統計數據。 |
tableFeatures | 字串陣列 | 數據表支持的數據表功能清單。 請參閱 Azure Databricks 如何管理 Delta Lake 功能相容性?。 |
clusteringColumns | 字串陣列 | 用於液體群集的數據行。 請參閱 使用差異數據表的液體群集 |
以下是輸出外觀的範例:
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+
|format| id| name|description| location| createdAt| lastModified|partitionColumns|numFiles|sizeInBytes|properties|minReaderVersion|minWriterVersion|
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+
| delta|d31f82d2-a69f-42e...|default.deltatable| null|file:/Users/tuor/...|2020-06-05 12:20:...|2020-06-05 12:20:20| []| 10| 12345| []| 1| 2|
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+