CACHE SELECT
Se aplica a: Databricks Runtime
Nota:
En almacenes de SQL o en Databricks Runtime 14.2 y versiones posteriores, se omite la función CACHE SELECT
.
Almacena en caché los datos a los que accede la consulta SELECT
simple especificada en la caché de disco.
Para elegir un subconjunto de columnas que se almacenarán en caché, proporcione una lista de nombres de columna y elija un subconjunto de filas proporcionando un predicado.
Esto permite que las consultas posteriores eviten examinar los archivos originales lo máximo posible.
Esta construcción solo es aplicable a las tablas Parquet y Delta.
También se admiten vistas, pero las consultas expandidas están restringidas a las consultas simples, como se ha descrito anteriormente.
Sintaxis
CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]
Consulte caché de disco frente a caché de Spark para las diferencias entre el almacenamiento en caché de disco y la caché de Apache Spark.
Parámetros
-
Identifica una tabla existente. El nombre no debe incluir una especificación temporal ni una especificación de opciones.
Ejemplos
CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3