Was sind die Stammverzeichnisse?
Azure Databricks hat in der Vergangenheit Verzeichnisse im Stammverzeichnis des Arbeitsbereichs als allgemeine Speicherorte verwendet. Die meisten dieser Speicherorte sind veraltet.
/Volumes
stellt einen Alias für den pfadbasierten Zugriff auf Daten in Unity-Katalogvolumes bereit. Weitere Informationen finden Sie unter Was sind Unity Catalog-Volumes?.
/databricks-datasets
/user/hive/warehouse
/FileStore
/databricks-results
/databricks/init
Was wird im Verzeichnis /databricks-datasets
gespeichert?
Das /databricks-datasets
-Verzeichnis ist für alle Zugriffsmoduskonfigurationen verfügbar, es sei denn, benutzerdefinierte Arbeitsbereichsberechtigungen, die von Arbeitsbereichsadministratoren festgelegt wurden, verhindern den Zugriff.
Databricks stellt eine Reihe von Open Source-Datasets in diesem Verzeichnis bereit. Viele der von Databricks bereitgestellten Tutorials und Demos verweisen auf diese Datasets, Sie können sie aber auch verwenden, um die Funktionalität von Azure Databricks unabhängig davon zu untersuchen.
Was wird im Verzeichnis /user/hive/warehouse
gespeichert?
Dies ist der Standardspeicherort für Daten für verwaltete Tabellen, die bei hive_metastore
registriert sind.
Was wird im Verzeichnis /Filestore
gespeichert?
Das /Filestore
-Verzeichnis kann Daten und Bibliotheken enthalten, die über die Azure Databricks-Benutzeroberfläche oder Bilddateien für generierte Plots hochgeladen wurden.
Dies ist in erster Linie Legacyverhalten, und die meisten Benutzeroberflächenoptionen laden jetzt Dateien mit Arbeitsbereichsdateien oder Volumes hoch.
Was wird im Verzeichnis /databricks-results
gespeichert?
/databricks-results
speichert Dateien, die durch Herunterladen der vollständigen Ergebnisse einer Abfrage generiert werden.
Was wird im Verzeichnis /databricks/init
gespeichert?
Einige Arbeitsbereiche können dieses Verzeichnis enthalten, das verwendet wurde, um ältere globale Init-Skripts zu speichern, die nicht verwendet werden sollten. Siehe Globale Init-Skripte (Legacy).