CACHE TABLE
適用対象: Databricks Runtime
Apache Spark キャッシュ内の指定されたストレージ レベルで、テーブルまたはクエリの出力の内容をキャッシュします。 クエリがキャッシュされている場合は、このクエリに対して一時ビューが作成されます。 これにより、以降のクエリで元のファイルのスキャンが軽減されます。
構文
CACHE [ LAZY ] TABLE table_name
[ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]
ディスク キャッシュと Apache Spark キャッシュの違いについては、「ディスク キャッシュとSpark キャッシュ」を参照してください。
パラメーター
LAZY
テーブルは、直ちにではなく、最初に使用されたときにのみキャッシュされます。
-
キャッシュするデルタ テーブルまたはビューを識別します。 名前には、 時仕様またはオプション指定を含めてはなりません。 テーブルが見つからない場合、Azure Databricks で TABLE_OR_VIEW_NOT_FOUND エラーが発生します。
OPTIONS ( ‘storageLevel’ [ = ] value )
storageLevel
キーと値のペアを持つOPTIONS
句。storageLevel
以外のキーが使用されると、警告が発行されます。storageLevel
の有効なオプションは次のとおりです。NONE
DISK_ONLY
DISK_ONLY_2
MEMORY_ONLY
MEMORY_ONLY_2
MEMORY_ONLY_SER
MEMORY_ONLY_SER_2
MEMORY_AND_DISK
MEMORY_AND_DISK_2
MEMORY_AND_DISK_SER
MEMORY_AND_DISK_SER_2
OFF_HEAP
storageLevel
に無効な値が設定されていると、例外がスローされます。storageLevel
が明示的にOPTIONS
句を使用して設定されていない場合、既定値storageLevel
はMEMORY_AND_DISK
に設定されます。query
キャッシュする行を生成するクエリ。 次のいずれかの形式を使用できます。
SELECT
ステートメントTABLE
ステートメントFROM
ステートメント
例
> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;