테이블 값 함수 cloud_files_state
적용 대상: Databricks SQL
Databricks Runtime 11.3 LTS 이상
자동 로더 또는 read_files
스트림의 파일 수준 상태를 반환합니다.
구문
cloud_files_state( { TABLE ( table_name ) | checkpoint } )
인수
-
table_name:
read_files
에 의해 작성되는 스트리밍 테이블의 식별자입니다. 이름에는 임시 사양이 포함되지 않아야 합니다. Databricks Runtime 13.3 LTS 이상에서 사용할 수 있습니다. -
checkpoint
: 리터럴입니다STRING
. 자동 로더 원본을 사용하는 스트림의 검사점 디렉터리입니다. 자동 로더란?을 참조하세요.
반품
다음 스키마가 있는 테이블을 반환합니다.
path STRING NOT NULL PRIMARY KEY
파일의 경로입니다.
size BIGINT NOT NULL
파일의 크기(바이트)입니다.
create_time TIMESTAMP NOT NULL
파일을 만든 시간입니다.
discovery_time TIMESTAMP NOT NULL
Important
이 기능은 현재 프라이빗 미리 보기로 제공됩니다. 이를 시도하려면 Azure Databricks 담당자에게 문의하세요.
파일이 검색된 시간입니다.
commit_time TIMESTAMP
Important
이 기능은 현재 프라이빗 미리 보기로 제공됩니다. 이를 시도하려면 Azure Databricks 담당자에게 문의하세요.
처리 후 파일이 검사점으로 커밋된 시간입니다.
NULL
파일이 아직 처리되지 않은 경우입니다. 파일이 처리될 수 있지만 나중에 임의로 커밋된 것으로 표시될 수 있습니다. 파일을 커밋된 파일로 표시하면 자동 로더에서 파일을 다시 처리할 필요가 없습니다.archive_time TIMESTAMP
Important
이 기능은 현재 프라이빗 미리 보기로 제공됩니다. 이를 시도하려면 Azure Databricks 담당자에게 문의하세요.
파일이 보관된 시간입니다.
NULL
파일이 보관되지 않은 경우입니다.source_id STRING
스트리밍 쿼리의 자동 로더 원본 ID입니다. 이 값은 단일 클라우드 개체 저장소 위치에서 수집하는 스트림에 대한 값입니다
'0'
.flow_name STRING
적용 대상:
Databricks SQL
Databricks Runtime 13.3 이상
flow_name
하나 이상의 클라우드 파일 원본을 포함하는 Delta Live Tables의 특정 스트리밍 흐름을 나타냅니다.NULL
지정되지 않은table_name
경우
사용 권한
다음이 필요합니다.
- 스트리밍 테이블 식별자를 사용하는 경우
OWNER
권한이 스트리밍 테이블에 필요합니다. -
READ FILES
외부 위치에 검사점을 제공하는 경우 검사점 위치에 대한 권한입니다.
예제
-- Simple example from checkpoint
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint');
/some/input/path
/other/input/path
-- Simple example from source subdir
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint/sources/0');
/some/input/path
/other/input/path
-- Simple example from streaming table
> SELECT path FROM CLOUD_FILES_STATE(TABLE(my_streaming_table));
/some/input/path
/other/input/path
관련된 문서
- 델타 라이브 테이블 사용하여 데이터 로드
- read_files 테이블 값 함수