Empfehlungen zum Arbeiten mit dem DBFS-Stamm
Azure Databricks verwendet das DBFS-Stammverzeichnis als Standardspeicherort für einige Workspace-Aktionen. Databricks empfiehlt, Produktionsdaten oder vertrauliche Informationen nicht im DBFS-Stamm zu speichern. Dieser Artikel befasst sich mit Empfehlungen zur Vermeidung der versehentlichen Offenlegung vertraulicher Daten im DBFS-Stamm.
Hinweis
Azure Databricks konfiguriert einen separaten privaten Speicherort für dauerhafte Daten und Konfigurationen im kundeneigenen Cloudspeicher, der als internes DBFS bezeichnet wird. Dieser Speicherort wird Benutzern nicht angezeigt.
Wichtig
Ab dem 6. März 2023 verwenden neue Azure Databricks-Arbeitsbereiche Azure Data Lake Storage Gen2 Speicherkonten für den DBFS-Stamm. Zuvor bereitgestellte Arbeitsbereiche verwenden Blob Storage.
Informieren von Benutzern, Daten nicht im DBFS-Stamm zu speichern
Da der DBFS-Stamm für alle Benutzer in einem Arbeitsbereich zugänglich ist, können alle Benutzer auf die hier gespeicherten Daten zugreifen. Es ist wichtig, Benutzer anzuweisen, diesen Ort nicht für die Speicherung vertraulicher Daten zu verwenden. Der Standardspeicherort für verwaltete Tabellen im Hive-Metastore in Azure Databricks ist der DBFS-Stamm. Um zu verhindern, dass Endbenutzer, die verwaltete Tabellen erstellen, in den DBFS-Stamm schreiben, deklarieren Sie beim Erstellen von Datenbanken im Hive-Metastore einen Speicherort im externen Speicher.
Verwaltete Unity Catalog-Tabellen verwenden standardmäßig einen sicheren Speicherort. Databricks empfiehlt die Verwendung von Unity Catalog für verwaltete Tabellen.
Verwenden der Überwachungsprotokollierung zum Überwachen der Aktivität
Hinweis
Ausführliche Informationen zu DBFS-Überwachungsereignissen finden Sie unter DBFS-Ereignisse.
Verschlüsseln von DBFS-Stammdaten mit einem kundenseitig verwalteten Schlüssel
Sie können DBFS-Stammdaten mit einem kundenseitig verwalteten Schlüssel verschlüsseln. Weitere Informationen finden Sie unter Kundenseitig verwaltete Schlüssel für den DBFS-Stamm.
Wichtig
Deaktivieren Sie Storage account key access
nicht für das Speicherkonto, in dem der DBFS-Stamm gesichert ist. Das Deaktivieren dieser Einstellung führt zu unerwarteten Verhaltensweisen und Fehlern.