CACHE SELECT
Gilt für: Databricks Runtime
Hinweis
In SQL-Warehouses oder in Databricks Runtime 14.2 und höher wird die CACHE SELECT
-Funktion ignoriert.
Speichert die Daten zwischen, auf die von der angegebenen einfachen SELECT
-Abfrage im Datenträgercache zugegriffen wird.
Sie können eine Teilmenge von Spalten auswählen, die zwischengespeichert werden soll, indem Sie eine Liste von Spaltennamen bereitstellen und mithilfe eines Prädikats eine Teilmenge von Zeilen auswählen.
Dies ermöglicht nachfolgende Abfragen wodurch eine Überprüfung der Originaldateien so weit wie möglich vermieden wird.
Dieses Konstrukt ist nur auf Delta- und Parquet-Tabellen anwendbar.
Ansichten werden ebenfalls unterstützt, doch die erweiterten Abfragen sind auf die oben beschriebenen einfachen Abfragen beschränkt.
Syntax
CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]
Unter Datenträgercache verglichen mit Spark-Cache finden Sie Unterschiede zwischen Datenträgercaching und dem Apache Spark-Cache.
Parameter
-
Hiermit wird eine vorhandene Tabelle identifiziert. Der Name darf keine zeitliche Spezifikation oder Optionsspezifikation enthalten.
Beispiele
CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3