CACHE SELECT
Van toepassing op: Databricks Runtime
Notitie
In SQL-warehouses of in Databricks Runtime 14.2 en hoger wordt de functie CACHE SELECT
genegeerd.
Slaat de gegevens in de cache op die worden geopend door de opgegeven eenvoudige SELECT
query in de schijfcache.
U kunt een subset kolommen kiezen die in de cache moeten worden opgeslagen door een lijst met kolomnamen op te geven en een subset van rijen te kiezen door een predicaat op te geven.
Hierdoor kunnen volgende query's voorkomen dat de oorspronkelijke bestanden zoveel mogelijk worden gescand.
Deze constructie is alleen van toepassing op Delta-tabellen en Parquet-tabellen.
Weergaven worden ook ondersteund, maar de uitgebreide query's zijn beperkt tot de eenvoudige query's, zoals hierboven beschreven.
Syntaxis
CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]
Zie Schijfcache versus Spark-cache voor de verschillen tussen schijfcache en de Apache Spark-cache.
Parameters
-
Identificeert een bestaande tabel. De naam mag geen tijdelijke specificatie of optiesspecificatie bevatten.
Voorbeelden
CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3