CACHE TABLE
Se aplica a: Databricks Runtime
Almacena en caché el contenido de una tabla o salida de una consulta con el nivel de almacenamiento dado en la caché de Apache Spark. Si una consulta se almacena en caché, se crea una vista temporal de esa consulta. Esto reduce el examen de los archivos originales en consultas futuras.
Sintaxis
CACHE [ LAZY ] TABLE table_name
[ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]
Consulte caché de disco frente a caché de Spark para las diferencias entre el almacenamiento en caché de disco y la caché de Apache Spark.
Parámetros
LAZY
Solo almacena en caché la tabla cuando se usa por primera vez, en lugar de inmediatamente.
-
Identifica la tabla o vista Delta que se va a almacenar en caché. El nombre no debe incluir una especificación temporal ni una especificación de opciones. Si no se encuentra la tabla, Azure Databricks genera un error TABLE_OR_VIEW_NOT_FOUND.
OPTIONS ( ‘storageLevel’ [ = ] value )
Cláusula
OPTIONS
con un par clave-valorstorageLevel
. Se emite una advertencia cuando se usa una clave distinta destorageLevel
. Las opciones válidas parastorageLevel
son:NONE
DISK_ONLY
DISK_ONLY_2
MEMORY_ONLY
MEMORY_ONLY_2
MEMORY_ONLY_SER
MEMORY_ONLY_SER_2
MEMORY_AND_DISK
MEMORY_AND_DISK_2
MEMORY_AND_DISK_SER
MEMORY_AND_DISK_SER_2
OFF_HEAP
Se produce una excepción cuando se establece un valor no válido para
storageLevel
. SistorageLevel
no se establece explícitamente mediante la cláusulaOPTIONS
, el valor predeterminado destorageLevel
se establece enMEMORY_AND_DISK
.consulta
Consulta que genera las filas que se almacenarán en caché. Puede estar en uno de los formatos siguientes:
- Una instrucción
SELECT
- Una instrucción
TABLE
- Una instrucción
FROM
- Una instrucción
Ejemplos
> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;