다음을 통해 공유


CACHE TABLE

적용 대상: 예로 표시된 확인 Databricks 런타임

Apache Spark 캐시에서 지정된 스토리지 수준으로 테이블 또는 쿼리의 출력 내용을 캐시합니다. 쿼리가 캐시되면 이 쿼리에 대한 임시 보기가 만들어집니다. 이렇게 하면 향후 쿼리에서 원본 파일의 검사가 줄어듭니다.

구문

CACHE [ LAZY ] TABLE table_name
  [ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]

디스크 캐싱과 Apache Spark 캐시의 차이점은 디스크 캐시와 Spark 캐시를 참조하세요.

매개 변수

  • LAZY

    즉시 캐시하는 대신 테이블을 처음 사용할 때만 캐시합니다.

  • table_name

    캐시할 델타 테이블 또는 뷰를 식별합니다. 이름에는 임시 사양 또는 옵션 사양이 포함되어서는 안됩니다. 테이블을 찾을 수 없는 경우 Azure Databricks는 TABLE_OR_VIEW_NOT_FOUND 오류를 발생시킵니다.

  • OPTIONS ( ‘storageLevel’ [ = ] value )

    OPTIONS 키와 값 쌍이 있는 storageLevel 절입니다. storageLevel이 아닌 키가 사용되면 경고가 발생합니다. 유효한 storageLevel 옵션은 다음과 같습니다.

    • NONE
      • DISK_ONLY
      • DISK_ONLY_2
      • MEMORY_ONLY
      • MEMORY_ONLY_2
      • MEMORY_ONLY_SER
      • MEMORY_ONLY_SER_2
      • MEMORY_AND_DISK
      • MEMORY_AND_DISK_2
      • MEMORY_AND_DISK_SER
      • MEMORY_AND_DISK_SER_2
      • OFF_HEAP

    storageLevel에 잘못된 값이 설정되면 예외가 throw됩니다. storageLevelOPTIONS 절을 사용하여 명시적으로 설정되지 않은 경우 storageLevel 기본값은 MEMORY_AND_DISK로 설정됩니다.

  • query

    캐시할 행을 생성하는 쿼리입니다. 다음 형식 중 하나일 수 있습니다.

    • SELECT
    • TABLE
    • FROM

예제

> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;