cloud_files_state
função que retorna um valor de tabela
Aplica-se a: Databricks SQL
Databricks Runtime 11.3 LTS e superior
Retorna o estado no nível de arquivo de um carregador automático ou read_files
fluxo.
Sintaxe
cloud_files_state( { TABLE ( table_name ) | checkpoint } )
Argumentos
-
table_name: O identificador da tabela de streaming que está a ser gravada por
read_files
. O nome não deve incluir uma especificação temporal. Disponível em Databricks Runtime 13.3 LTS e superior. -
checkpoint
: UmSTRING
literal. O diretório de ponto de verificação para um fluxo usando a fonte Auto Loader. Consulte O que é Auto Loader?.
Devoluções
Retorna uma tabela com o seguinte esquema:
path STRING NOT NULL PRIMARY KEY
O caminho de um arquivo.
size BIGINT NOT NULL
O tamanho de um arquivo em bytes.
create_time TIMESTAMP NOT NULL
A hora em que um arquivo foi criado.
discovery_time TIMESTAMP NOT NULL
Importante
Esta funcionalidade está em Pré-visualização Privada. Para a experimentar, contacte o representante do Azure Databricks.
A hora em que um arquivo foi descoberto.
commit_time TIMESTAMP
Importante
Esta funcionalidade está em Pré-visualização Privada. Para a experimentar, contacte o representante do Azure Databricks.
O tempo que um arquivo foi confirmado no ponto de verificação após o processamento.
NULL
se o ficheiro ainda não estiver processado. Um arquivo pode ser processado, mas pode ser marcado como confirmado arbitrariamente mais tarde. Marcar o arquivo como confirmado significa que o Auto Loader não requer o arquivo para processamento novamente.archive_time TIMESTAMP
Importante
Esta funcionalidade está em Pré-visualização Privada. Para a experimentar, contacte o representante do Azure Databricks.
A hora em que um arquivo foi arquivado.
NULL
se o ficheiro não tiver sido arquivado.source_id STRING
A ID da origem do Auto Loader na consulta de streaming. Esse valor é
'0'
para fluxos que ingerem de um único local de armazenamento de objetos na nuvem.flow_name STRING
Aplica-se a:
Databricks SQL
Databricks Runtime 13.3 e superior
O
flow_name
representa um fluxo de streaming específico no Delta Live Tables que contém uma ou mais fontes de arquivos na nuvem.NULL
se nãotable_name
foi dado.
Permissões
Você precisa ter:
-
OWNER
privilégios na tabela de streaming se estiver usando um identificador de tabela de streaming. -
READ FILES
privilégios no local do ponto de verificação se fornecer um ponto de verificação em um local externo.
Exemplos
-- Simple example from checkpoint
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint');
/some/input/path
/other/input/path
-- Simple example from source subdir
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint/sources/0');
/some/input/path
/other/input/path
-- Simple example from streaming table
> SELECT path FROM CLOUD_FILES_STATE(TABLE(my_streaming_table));
/some/input/path
/other/input/path