다음을 통해 공유


read_statestore 테이블 반환 함수

적용 대상: 예로 표시된 확인 Databricks SQL 예로 표시된 확인 Databricks Runtime 14.3 이상

Important

이 기능은 공개 미리 보기 상태입니다.

스트리밍 쿼리의 상태 저장소에서 레코드를 읽기 위한 테이블 반환 함수입니다. 반환된 관계는 일괄 처리 쿼리로만 실행할 수 있습니다.

구문

read_statestore ( path [, option_key => option_value ] [ ... ] )

인수

read_statestore 에는 선택적 매개 변수에 대해 명명된 매개 변수 호출 이 필요합니다.

  • path: STRING literal입니다. 스트리밍 쿼리 검사점 위치의 경로입니다.
  • option_key: 구성할 옵션의 이름입니다. 점(.)을 포함하는 옵션에는 백틱(')을 사용해야 합니다.
  • option_value: 옵션을 설정할 상수 식입니다. 리터럴 및 스칼라 함수를 허용합니다.

모두 option_value대/소문자를 구분하지 않습니다.

option_key Type 기본값 설명
batchId BIGINT 최신 일괄 처리 ID 읽을 대상 배치를 나타냅니다. 이 옵션은 사용자가 시간 여행을 수행하려는 경우에 사용됩니다. 일괄 처리는 커밋되어야 하지만 아직 정리되지 않았습니다.
OperatorId BIGINT 0 읽을 대상 연산자를 나타냅니다. 이 옵션은 쿼리에서 여러 상태 저장 연산자를 사용하는 경우에 사용됩니다.
storeName STRING 'DEFAULT' 읽을 대상 쪽을 나타냅니다. 이 옵션은 사용자가 스트림 스트림 조인에서 상태를 읽으려는 경우에 사용됩니다.
joinSide STRING 'None' 읽을 대상 쪽을 나타냅니다. 이 옵션은 사용자가 스트림 스트림 조인에서 상태를 읽으려는 경우에 사용됩니다. 'Left', 'Right', 'None' 중 하나입니다.

반품

이 함수는 다음 열이 있는 결과 집합을 반환합니다.

참고 항목

키 및 값에 대한 중첩 열은 상태 저장 연산자의 입력 스키마와 연산자 유형에 따라 크게 달라집니다.

속성 데이터 형식 Nullable Standard 설명
id STRUCT 아니요 상태 검사점에 저장된 상태 저장 연산자의 키 행입니다.
value STRUCT 상태 검사점에 저장된 상태 저장 연산자의 값 행입니다.
partition_id INTEGER 아니요 레코드를 포함하는 파티션입니다.
shardId STRING 아니요 데이터를 읽은 분할된 데이터베이스의 고유 식별자입니다.
sequenceNumber BIGINT 아니요 분할된 데이터베이스 내 레코드의 고유 식별자입니다.
approximateArrivalTimestamp TIMESTAMP 아니요 레코드가 스트림에 삽입된 대략적인 시간입니다.

예제

- Read from state
> SELECT * FROM read_statestore('/checkpoint/path');

– Read from state with storeName option
> SELECT * FROM read_statestore(
      '/checkpoint/path',
      operatorId => 0,
      batchId => 2,
      storeName => 'default'
  );

– Read from state with joinSide option

> SELECT * FROM read_statestore(
      '/checkpoint/path',
      joinSide => 'left'
  );