CACHE TABLE
Gilt für: Databricks Runtime
Speichert den Inhalt einer Tabelle oder der Ausgabe einer Abfrage mit der angegebenen Speicherebene in Apache Spark-Cache zwischen. Wenn eine Abfrage zwischengespeichert wird, wird eine temporäre Sicht für diese Abfrage erstellt. Dadurch wird der Überprüfungsaufwand der ursprünglichen Dateien in zukünftigen Abfragen reduziert.
Syntax
CACHE [ LAZY ] TABLE table_name
[ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]
Unter Datenträgercache verglichen mit Spark-Cache finden Sie Unterschiede zwischen Datenträgercaching und dem Apache Spark-Cache.
Parameter
LAZY
Die Tabelle wird nicht sofort, sondern bei der ersten Verwendung zwischengespeichert.
-
Identifiziert die Delta-Tabelle oder -Ansicht, zum Cache. Der Name darf keine zeitliche Spezifikation oder Optionsspezifikation enthalten. Wenn die Tabelle nicht gefunden werden kann, löst Azure Databricks den Fehler TABLE_OR_VIEW_NOT_FOUND aus.
OPTIONS ( ‘storageLevel’ [ = ] value )
OPTIONS
-Klausel mitstorageLevel
-Schlüssel und Wertpaar. Wenn ein anderer Schlüssel alsstorageLevel
verwendet wird, wird eine Warnung ausgegeben. Die gültigen Optionen fürstorageLevel
sind:NONE
DISK_ONLY
DISK_ONLY_2
MEMORY_ONLY
MEMORY_ONLY_2
MEMORY_ONLY_SER
MEMORY_ONLY_SER_2
MEMORY_AND_DISK
MEMORY_AND_DISK_2
MEMORY_AND_DISK_SER
MEMORY_AND_DISK_SER_2
OFF_HEAP
Wenn ein ungültiger Wert für
storageLevel
festgelegt wird, wird eine Ausnahme ausgelöst. WennstorageLevel
nicht explizit mit derOPTIONS
-Klausel festgelegt wird, wirdstorageLevel
standardmäßig aufMEMORY_AND_DISK
festgelegt.query
Eine Abfrage, die die zwischenzuspeichernden Zeilen erzeugt. Sie kann eines der folgenden Formate aufweisen:
- Eine
SELECT
-Anweisung - Eine
TABLE
-Anweisung - Eine
FROM
-Anweisung
- Eine
Beispiele
> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;