¿Qué es DBFS?
El término DBFS se usa para describir dos partes de la plataforma:
- Raíz de DBFS
- Montajes de DBFS
El almacenamiento y el acceso a datos mediante montajes raíz o DBFS de DBFS es un patrón en desuso y no es recomendado por Databricks. Para obtener recomendaciones para trabajar con archivos, vea Trabajar con archivos en Azure Databricks.
¿Cuál es el sistema de archivos de Databricks?
El término DBFS procede del sistema de archivos de Databricks, que describe el sistema de archivos distribuido usado por Azure Databricks para interactuar con el almacenamiento basado en la nube.
La tecnología subyacente asociada a DBFS sigue siendo parte de la plataforma de Azure Databricks. Por ejemplo, dbfs:/
es un esquema opcional al interactuar con volúmenes de Unity Catalog.
Las advertencias y advertencias anteriores y actuales sobre DBFS solo se aplican a los montajes raíz o DBFS raíz de DBFS.
¿Cómo funciona DBFS con Unity Catalog?
Databricks recomienda usar Unity Catalog para administrar el acceso a todos los datos.
Unity Catalog agrega los conceptos de ubicaciones externas, credenciales de almacenamiento y volúmenes para ayudar a las organizaciones a proporcionar el acceso con privilegios mínimos a los datos en el almacenamiento de objetos en la nube.
Algunas configuraciones de seguridad proporcionan acceso directo a los recursos administrados por Unity Catalog y DBFS, principalmente para organizaciones que han completado migraciones o parcialmente migradas al Unity Catalog. Consulte Procedimientos recomendados para DBFS y el catálogo de Unity.
¿Qué es la raíz de DBFS?
El raíz de DBFS es una ubicación de almacenamiento aprovisionada durante la creación del área de trabajo en la cuenta en la nube que contiene el área de trabajo de Azure Databricks. Para más información sobre la configuración e implementación de la raíz de DBFS, consulte el inicio rápido de Azure Databricks.
Databricks no recomienda almacenar datos de producción, bibliotecas ni scripts en la raíz de DBFS. Consulte Recomendaciones para trabajar con raíces de DBFS.
Para configurar claves administradas por el cliente para la cuenta de almacenamiento que incluye la raíz de DBFS, consulte Claves administradas por el cliente para la raíz de DBFS.
Para limitar el acceso de red a la cuenta de almacenamiento que incluye la raíz de DBFS, consulte Habilitación de la compatibilidad del firewall con la cuenta de almacenamiento del área de trabajo.
Montaje del almacenamiento de objetos
Nota:
Los montajes DBFS están en desuso. Databricks recomienda usar volúmenes de Unity Catalog. Consulte ¿Qué son los volúmenes de Unity Catalog?.
El montaje del almacenamiento de objetos en DBFS permite acceder a objetos en el almacenamiento de objetos, como si estuvieran en el sistema de archivos local. Los montajes almacenan las configuraciones de Hadoop necesarias para acceder al almacenamiento. Para más información, consulte Montaje del almacenamiento de objetos en la nube en Azure Databricks.