Aanbevelingen voor het werken met DBFS-hoofdmap
Azure Databricks gebruikt de DBFS-hoofdmap als een standaardlocatie voor sommige werkruimteacties. Databricks raadt aan om productiegegevens of gevoelige informatie op te slaan in de DBFS-hoofdmap. Dit artikel is gericht op aanbevelingen om onbedoelde blootstelling van gevoelige gegevens in de DBFS-hoofdmap te voorkomen.
Notitie
Azure Databricks configureert een afzonderlijke privéopslaglocatie voor het persistent maken van gegevens en configuraties in cloudopslag die eigendom is van de klant, ook wel de interne DBFS genoemd. Deze locatie is niet zichtbaar voor gebruikers.
Belangrijk
Vanaf 6 maart 2023 gebruiken nieuwe Azure Databricks-werkruimten Azure Data Lake Storage Gen2-opslagaccounts voor de DBFS-hoofdmap. Eerder ingerichte werkruimten maken gebruik van Blob Storage.
Gebruikers informeren dat ze geen gegevens kunnen opslaan in de DBFS-hoofdmap
Omdat de DBFS-hoofdmap toegankelijk is voor alle gebruikers in een werkruimte, hebben alle gebruikers toegang tot alle gegevens die hier zijn opgeslagen. Het is belangrijk dat u gebruikers instrueert om te voorkomen dat ze deze locatie gebruiken voor het opslaan van gevoelige gegevens. De standaardlocatie voor beheerde tabellen in de Hive-metastore in Azure Databricks is de DBFS-hoofdmap; als u wilt voorkomen dat eindgebruikers die beheerde tabellen maken naar de DBFS-hoofdmap schrijven, declareert u een locatie in externe opslag bij het maken van databases in de Hive-metastore.
Beheerde tabellen in Unity Catalog maken standaard gebruik van een beveiligde opslaglocatie. Databricks raadt het gebruik van Unity Catalog aan voor beheerde tabellen.
Auditlogboeken gebruiken om activiteiten te bewaken
Notitie
Zie DBFS-gebeurtenissen voor meer informatie over DBFS-controlegebeurtenissen.
DBFS-hoofdgegevens versleutelen met een door de klant beheerde sleutel
U kunt DBFS-hoofdgegevens versleutelen met een door de klant beheerde sleutel. Door de klant beheerde sleutels voor DBFS-hoofdmap weergeven
Belangrijk
Schakel niet uit Storage account key access
voor het opslagaccount dat back-ups maakt van de DBFS-hoofdmap. Als u deze instelling uitschakelt, leidt dit tot onverwacht gedrag en fouten.