cloud_files_state
funzione con valori di tabella
Si applica a: Databricks SQL Databricks Runtime 11.3 LTS e versioni successive
Restituisce lo stato a livello di file di un caricatore automatico o read_files
di un flusso.
Sintassi
cloud_files_state( { TABLE ( table_name ) | checkpoint } )
Argomenti
- table_name: identificatore della tabella di streaming scritta da
read_files
. Il nome non deve includere una specifica temporale. Disponibile in Databricks Runtime 13.3 LTS e versioni successive. checkpoint
: valoreSTRING
letterale. Directory del checkpoint per un flusso usando l'origine del caricatore automatico. Vedere Che cos'è l’Autoloader?.
Valori restituiti
Restituisce una tabella con lo schema seguente:
path STRING NOT NULL PRIMARY KEY
Percorso di un file.
size BIGINT NOT NULL
Dimensioni di un file in byte.
create_time TIMESTAMP NOT NULL
Ora di creazione di un file.
discovery_time TIMESTAMP NOT NULL
Importante
Questa funzionalità è in anteprima privata. Per provarla, rivolgersi al contatto di Azure Databricks.
Ora in cui è stato individuato un file.
commit_time TIMESTAMP
Importante
Questa funzionalità è in anteprima privata. Per provarla, rivolgersi al contatto di Azure Databricks.
Ora in cui è stato eseguito il commit di un file nel checkpoint dopo l'elaborazione.
NULL
se il file non è ancora stato elaborato. Un file potrebbe essere elaborato, ma potrebbe essere contrassegnato come sottoposto a commit arbitrariamente in un secondo momento. Contrassegnare il file come di cui è stato eseguito il commit significa che il caricatore automatico non richiede di nuovo il file per l'elaborazione.archive_time TIMESTAMP
Importante
Questa funzionalità è in anteprima privata. Per provarla, rivolgersi al contatto di Azure Databricks.
Ora in cui un file è stato archiviato.
NULL
se il file non è stato archiviato.source_id STRING
ID dell'origine del caricatore automatico nella query di streaming. Questo valore è
'0'
per i flussi che inseriscono da un'unica posizione dell'archivio oggetti cloud.flow_name STRING
Si applica a: Databricks SQL Databricks Runtime 13.3 e versioni successive
flow_name
Rappresenta un flusso di streaming specifico nelle tabelle Live Delta che contiene una o più origini file cloud.NULL
se non è stato dato alcun risultatotable_name
.
Autorizzazioni
È necessario disporre di:
OWNER
privilegi nella tabella di streaming se si usa un identificatore di tabella di streaming.READ FILES
privilegi nella posizione del checkpoint se si specifica un checkpoint in una posizione esterna.
Esempi
-- Simple example from checkpoint
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint');
/some/input/path
/other/input/path
-- Simple example from source subdir
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint/sources/0');
/some/input/path
/other/input/path
-- Simple example from streaming table
> SELECT path FROM CLOUD_FILES_STATE(TABLE(my_streaming_table));
/some/input/path
/other/input/path