CACHE TABLE
Van toepassing op: Databricks Runtime
Slaat de inhoud van een tabel of uitvoer van een query in de cache op met het opgegeven opslagniveau in de Apache Spark-cache. Als een query in de cache is opgeslagen, wordt er een tijdelijke weergave gemaakt voor deze query. Dit vermindert het scannen van de oorspronkelijke bestanden in toekomstige query's.
Syntaxis
CACHE [ LAZY ] TABLE table_name
[ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]
Zie Schijfcache versus Spark-cache voor de verschillen tussen schijfcache en de Apache Spark-cache.
Parameters
LUI
Sla de tabel alleen in de cache op wanneer deze voor het eerst wordt gebruikt, in plaats van onmiddellijk.
-
Identificeert de Delta-tabel of -weergave die in de cache moet worden opgeslagen. De naam mag geen tijdelijke specificatie of optiesspecificatie bevatten. Als de tabel niet kan worden gevonden, genereert Azure Databricks een TABLE_OR_VIEW_NOT_FOUND-fout.
OPTIONS ( 'storageLevel' [ = ] value )
OPTIONS
component metstorageLevel
sleutel- en waardepaar. Er wordt een waarschuwing weergegeven wanneer een andere sleutel danstorageLevel
wordt gebruikt. De geldige opties zijnstorageLevel
:NONE
DISK_ONLY
DISK_ONLY_2
MEMORY_ONLY
MEMORY_ONLY_2
MEMORY_ONLY_SER
MEMORY_ONLY_SER_2
MEMORY_AND_DISK
MEMORY_AND_DISK_2
MEMORY_AND_DISK_SER
MEMORY_AND_DISK_SER_2
OFF_HEAP
Er wordt een uitzondering gegenereerd wanneer er een ongeldige waarde is ingesteld voor
storageLevel
. AlsstorageLevel
niet expliciet is ingesteld metOPTIONS
clausule, wordt de standaardstorageLevel
ingesteld opMEMORY_AND_DISK
.query
Een query die de rijen produceert die in de cache moeten worden opgeslagen. Dit kan een van de volgende indelingen hebben:
- Een
SELECT
instructie - Een
TABLE
instructie - Een
FROM
instructie
- Een
Voorbeelden
> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;