CACHE TABLE
Aplica-se a: Databricks Runtime
Armazena em cache o conteúdo de uma table ou saída de uma consulta com o nível de armazenamento fornecido no cache do Apache Spark. Se uma consulta for armazenada em cache, uma exibição temporária será criada para essa consulta. Isso reduz a verificação dos arquivos originais em consultas futuras.
Sintaxe
CACHE [ LAZY ] TABLE table_name
[ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]
Consulte Cache de disco versus cache Spark para saber as diferenças entre o cache de disco e o cache do Apache Spark.
Parameters
Preguiçoso
Armazene em cache apenas o table quando ele for usado pela primeira vez, em vez de imediatamente.
-
Identifica a Delta table ou a visualização para cache. O nome não deve incluir uma especificação temporal ou uma especificação de opções. Se o table não puder ser encontrado, o Azure Databricks gerará um erro TABLE_OR_VIEW_NOT_FOUND.
OPTIONS ( 'storageLevel' [ = ] valor )
OPTIONS
cláusula comstorageLevel
par chave e valor. Um aviso é emitido quando uma chave diferente éstorageLevel
usada. As opções válidas parastorageLevel
são:NONE
DISK_ONLY
DISK_ONLY_2
MEMORY_ONLY
MEMORY_ONLY_2
MEMORY_ONLY_SER
MEMORY_ONLY_SER_2
MEMORY_AND_DISK
MEMORY_AND_DISK_2
MEMORY_AND_DISK_SER
MEMORY_AND_DISK_SER_2
OFF_HEAP
Uma exceção é lançada quando um valor inválido é set para
storageLevel
. SestorageLevel
não estiver explicitamente set usando a cláusulaOPTIONS
, ostorageLevel
padrão será set paraMEMORY_AND_DISK
.query
Uma consulta que produz as linhas a serem armazenadas em cache. Pode ser em um dos seguintes formatos:
- Uma
SELECT
declaração - Uma
TABLE
declaração - Uma
FROM
declaração
- Uma
Exemplos
> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;