read_statestore
table값을 갖는 함수
적용 대상: Databricks SQL Databricks Runtime 14.3 이상
Important
이 기능은 공개 미리 보기 상태입니다.
스트리밍 쿼리의 상태 저장소에서 레코드를 읽기 위해 table값을 반환하는 함수입니다. 반환된 관계는 일괄 처리 쿼리로만 실행할 수 있습니다.
구문
read_statestore ( path [, option_key => option_value ] [ ... ] )
인수
-
path
:STRING literal
입니다. 스트리밍 쿼리 검사점 위치의 경로입니다. -
option_key
: 구성할 옵션의 이름입니다. 점(.)을 포함하는 옵션에는 백틱(')을 사용해야 합니다. -
option_value
: 옵션을 set로 설정하는 상수 표현입니다. 리터럴 및 스칼라 함수를 허용합니다.
모두 option_value
대/소문자를 구분하지 않습니다.
option_key | Type | 기본값 | 설명 |
---|---|---|---|
batchId |
BIGINT |
최신 일괄 처리 ID | 읽을 대상 배치를 나타냅니다. 이 옵션은 사용자가 시간 여행을 수행하려는 경우에 사용됩니다. 일괄 처리는 커밋되어야 하지만 아직 정리되지 않았습니다. |
OperatorId |
BIGINT |
0 | 읽을 대상 연산자를 나타냅니다. 이 옵션은 쿼리에서 여러 상태 저장 연산자를 사용하는 경우에 사용됩니다. |
storeName |
STRING |
'DEFAULT' |
읽을 대상 쪽을 나타냅니다. 이 옵션은 사용자가 스트림 스트림 join상태를 읽으려는 경우에 사용됩니다. |
joinSide |
STRING |
'None' |
읽을 대상 쪽을 나타냅니다. 이 옵션은 사용자가 스트림 스트림 join상태를 읽으려는 경우에 사용됩니다.
'Left' , 'Right' , 'None' 중 하나입니다. |
반품
이 함수는 다음 columns과 함께 결과 set을 반환합니다.
참고 항목
키와 값에 대한 중첩된 columns은 상태 저장 연산자의 입력 schema과 연산자의 유형에 크게 의존합니다.
속성 | 데이터 형식 | Nullable | Standard | 설명 |
---|---|---|---|---|
id |
STRUCT |
아니요 | 상태 검사점에 저장된 상태 저장 연산자의 키 행입니다. | |
value |
STRUCT |
예 | 상태 검사점에 저장된 상태 저장 연산자의 값 행입니다. | |
partition_id |
INTEGER |
아니요 | 레코드를 포함하는 partition. | |
shardId |
STRING |
아니요 | 데이터가 읽힌 샤드 where에 대한 고유한 identifier. | |
sequenceNumber |
BIGINT |
아니요 | 분할된 데이터베이스 내 레코드의 고유한 identifier. | |
approximateArrivalTimestamp |
TIMESTAMP |
아니요 | 레코드가 스트림에 삽입된 대략적인 시간입니다. |
예제
- Read from state
> SELECT * FROM read_statestore('/checkpoint/path');
– Read from state with storeName option
> SELECT * FROM read_statestore(
'/checkpoint/path',
operatorId => 0,
batchId => 2,
storeName => 'default'
);
– Read from state with joinSide option
> SELECT * FROM read_statestore(
'/checkpoint/path',
joinSide => 'left'
);
관련된 함수
- read_files table값을 갖는 함수
- read_kafka table값을 가지는 함수
- 스트리밍
-valued 함수 read_kinesis