什麼是 DBFS?
DBFS 一詞用來描述平臺的兩個部分:
- DBFS 根目錄
- DBFS 掛接
使用 DBFS 根或 DBFS 掛接來儲存和存取資料是已被取代的模式,Databricks 不建議這麼做。 如需使用檔案的建議,請參閱 使用 Azure Databricks 上的檔案。
什麼是 Databricks 檔案系統?
DBFS 一詞來自 Databricks 檔案系統,其描述 Azure Databricks 用來與雲端式記憶體互動的分散式文件系統。
與 DBFS 相關聯的基礎技術仍然是 Azure Databricks 平臺的一部分。 例如, dbfs:/
與 Unity 目錄磁碟區互動時,是選擇性的配置。
DBFS 的過去和目前警告和警告僅適用於 DBFS 根或 DBFS 掛接。
DBFS 如何搭配 Unity 目錄使用?
Databricks 建議使用 Unity 目錄來管理所有數據的存取權。
Unity 目錄新增外部位置、記憶體認證和磁碟區的概念,以協助組織為雲端物件記憶體中的數據提供最低許可權存取權。
某些安全性設定可讓您直接存取 Unity 目錄管理的資源和 DBFS,主要是針對已完成移轉或部分移轉至 Unity 目錄的組織。 請參閱適用於 DBFS 和 Unity 目錄的最佳做法。
什麼是 DBFS 根目錄?
DBFS 根目錄是在包含 Azure Databricks 工作區的雲端帳戶中建立工作區期間布建的記憶體位置。 如需 DBFS 根設定和部署的詳細資訊,請參閱 Azure Databricks 快速入門。
Databricks 不建議將生產數據、連結庫或腳本儲存在 DBFS 根目錄中。 請參閱 使用 DBFS 根目錄的建議。
若要為包含 DBFS 根目錄的記憶體帳戶設定客戶管理的密鑰,請參閱 DBFS 根目錄的客戶自控密鑰。
若要限制對包含 DBFS 根目錄之記憶體帳戶的網路存取,請參閱 啟用工作區記憶體帳戶的防火牆支援。
掛接物件記憶體
注意
DBFS 掛接已被取代。 Databricks 建議使用 Unity 目錄磁碟區。 請參閱Unity Catalog 磁碟區是什麼?。
將物件記憶體掛接至 DBFS 可讓您存取物件記憶體中的物件,就像它們位於本機檔案系統上一樣。 掛接會儲存存取記憶體所需的Hadoop組態。 如需詳細資訊,請參閱在 Azure Databricks 上掛接雲端物件儲存體。