CACHE TABLE
적용 대상: Databricks 런타임
Apache Spark 캐시에서 지정된 스토리지 수준으로 테이블 또는 쿼리의 출력 내용을 캐시합니다. 쿼리가 캐시되면 이 쿼리에 대한 임시 보기가 만들어집니다. 이렇게 하면 향후 쿼리에서 원본 파일의 검사가 줄어듭니다.
구문
CACHE [ LAZY ] TABLE table_name
[ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]
디스크 캐싱과 Apache Spark 캐시의 차이점은 디스크 캐시와 Spark 캐시를 참조하세요.
매개 변수
LAZY
즉시 캐시하는 대신 테이블을 처음 사용할 때만 캐시합니다.
-
캐시할 델타 테이블 또는 뷰를 식별합니다. 이름에는 임시 사양 또는 옵션 사양이 포함되어서는 안됩니다. 테이블을 찾을 수 없는 경우 Azure Databricks는 TABLE_OR_VIEW_NOT_FOUND 오류를 발생시킵니다.
OPTIONS ( ‘storageLevel’ [ = ] value )
OPTIONS
키와 값 쌍이 있는storageLevel
절입니다.storageLevel
이 아닌 키가 사용되면 경고가 발생합니다. 유효한storageLevel
옵션은 다음과 같습니다.NONE
DISK_ONLY
DISK_ONLY_2
MEMORY_ONLY
MEMORY_ONLY_2
MEMORY_ONLY_SER
MEMORY_ONLY_SER_2
MEMORY_AND_DISK
MEMORY_AND_DISK_2
MEMORY_AND_DISK_SER
MEMORY_AND_DISK_SER_2
OFF_HEAP
storageLevel
에 잘못된 값이 설정되면 예외가 throw됩니다.storageLevel
이OPTIONS
절을 사용하여 명시적으로 설정되지 않은 경우storageLevel
기본값은MEMORY_AND_DISK
로 설정됩니다.query
캐시할 행을 생성하는 쿼리입니다. 다음 형식 중 하나일 수 있습니다.
SELECT
문TABLE
문FROM
문
예제
> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;