CACHE SELECT;
Область применения: Databricks Runtime
Примечание.
В хранилищах SQL или в Databricks Runtime 14.2 и более поздних версий функция CACHE SELECT
игнорируется.
Помещает в кэш диска данные, к которым обращается указанный простой запрос SELECT
.
Вы можете выбрать подмножество столбцов для кэширования, предоставив список имен столбцов, и подмножество строк, предоставив предикат.
Это позволяет последующим запросам максимально избегать сканирования исходных файлов.
Эта конструкция применима только к таблицам Delta и таблицам Parquet.
Представления также поддерживаются, но расширенные запросы ограничиваются возможностями простых запросов, как описано выше.
Синтаксис
CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]
Сведения о различиях между кэшированием дисков и кэшем Apache Spark см. в кэше дисков и Spark.
Параметры
-
Указывает существующую таблицу. Имя не должно включать темпоральную спецификацию или спецификацию параметров.
Примеры
CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3