REFRESH CACHE
Gilt für: Databricks Runtime
Macht alle zwischengespeicherten Daten (und die zugehörigen Metadaten) im Apache Spark-Cache für alle Datasets, die den angegebenen Datenquellenpfad enthalten, ungültig und aktualisiert sie. Der Pfadabgleich erfolgt anhand des Präfixes. /
macht würde somit alles, was zwischengespeichert wird, ungültig machen.
Weitere Informationen zum Aktualisieren der Daten in Streamingtabellen und materialisierten Sichten finden Sie unter REFRESH (MATERIALIZED VIEW oder STREAMING TABLE).
Syntax
REFRESH resource_path
Unter Datenträgercache verglichen mit Spark-Cache finden Sie Unterschiede zwischen Datenträgercaching und dem Apache Spark-Cache.
Parameter
resource_path
Der Pfad der Ressource, die aktualisiert werden soll.
Beispiele
-- The Path is resolved using the datasource's File Index.
> CREATE TABLE test(ID INT) using parquet;
> INSERT INTO test SELECT 1000;
> CACHE TABLE test;
> INSERT INTO test SELECT 100;
> REFRESH "hdfs://path/to/table";