cloud_files_state
table值函式
適用於: Databricks SQL Databricks Runtime 11.3 LTS 和更新版本
傳回自動載入器或 read_files
數據流的檔案層級狀態。
語法
cloud_files_state( { TABLE ( table_name ) | checkpoint } )
引數
-
table_name:
read_files
所寫入之 串流 table 的 identifier。 名稱不得包含時態性規格。 適用於 Databricks Runtime 13.3 LTS 和更新版本。 -
checkpoint
:常STRING
值。 使用自動載入器來源之數據流的檢查點目錄。 請參閱 什麼是自動載入器?。
傳回
傳回具有下列 schema的 table:
path STRING NOT NULL PRIMARY KEY
檔案的路徑。
size BIGINT NOT NULL
以位元組為單位的檔案大小。
create_time TIMESTAMP NOT NULL
建立檔案的時間。
discovery_time TIMESTAMP NOT NULL
重要
這項功能處於個人預覽版狀態。 若要試用,請洽詢您的 Azure Databricks 連絡人。
探索到檔案的時間。
commit_time TIMESTAMP
重要
這項功能處於個人預覽版狀態。 若要試用,請洽詢您的 Azure Databricks 連絡人。
檔案在處理后認可到檢查點的時間。
NULL
如果尚未處理檔案,則為 。 可能會處理檔案,但稍後可能會任意標示為已認可。 將檔案標示為已認可表示自動載入器不需要檔案再次處理。archive_time TIMESTAMP
重要
這項功能處於個人預覽版狀態。 若要試用,請洽詢您的 Azure Databricks 連絡人。
封存盤案的時間。
NULL
如果檔案尚未封存,則為 。source_id STRING
串流查詢中自動載入器來源的標識碼。 這個值適用於
'0'
從單一雲端物件存放區位置擷取的數據流。flow_name STRING
適用於: Databricks SQL Databricks Runtime 13.3 和更新版本
flow_name
代表 Delta Live Tables 中含有一或多個雲端檔案來源的特定串流流程。NULL
table_name
如果未指定 ,則為 。
權限
您需要具備:
- 如果使用串流 tableidentifier,
OWNER
串流 table 的許可權。 -
READ FILES
如果在外部位置下 提供檢查點,則為檢查點位置的許可權。
範例
-- Simple example from checkpoint
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint');
/some/input/path
/other/input/path
-- Simple example from source subdir
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint/sources/0');
/some/input/path
/other/input/path
-- Simple example from streaming table
> SELECT path FROM CLOUD_FILES_STATE(TABLE(my_streaming_table));
/some/input/path
/other/input/path