CACHE SELECT
Aplica-se a: Databricks Runtime
Observação
Em SQL warehouses ou no Databricks Runtime 14.2 e superior, a função CACHE SELECT
é ignorada.
Armazena em cache os dados acessados pela consulta SELECT
simples especificada no cache de disco.
Você pode escolher um subconjunto de colunas a ser armazenado em cache fornecendo uma lista de nomes de colunas e escolher um subconjunto de linhas fornecendo um predicado.
Isso permite que as consultas seguintes evitem examinar os arquivos originais o máximo possível.
Esse constructo é aplicável apenas a tabelas Delta e Parquet.
Também há suporte para exibições, mas as consultas expandidas são restritas às consultas simples, conforme descrito acima.
Sintaxe
CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]
Veja Cache de disco vs. Cache Spark para as diferenças entre o cache de disco e o cache Apache Spark.
Parâmetros
-
Identifica uma tabela existente. O nome não deve incluir uma especificação temporal ou especificação de opções.
Exemplos
CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3