Acceso a datos compartidos con usted mediante Delta Sharing (para destinatarios)
En este artículo se muestra cómo acceder a los datos que se han compartido con usted mediante el uso compartido de Delta.
Delta Sharing y destinatarios de datos
Delta Sharing es un estándar abierto para el uso compartido seguro de datos. Un usuario de Databricks, denominado proveedor de datos en este contexto, puede usar Delta Sharing en Azure Databricks para compartir datos con una persona o grupo fuera de su organización, denominado destinatario de datos.
Uso compartido de Databricks a Databricks y uso compartido abierto
La forma de acceder a los datos depende de si es un usuario de Databricks y de si el proveedor de datos configuró o no los datos que se comparten con usted para el uso compartido de Databricks a Databricks o el uso compartido abierto.
En el modelo de Databricks a Databricks, debe ser un usuario en un área de trabajo de Databricks habilitada para Unity Catalog. Un miembro del equipo proporciona al proveedor de datos un identificador único para el metastore de Unity Catalog y el proveedor de datos lo usa para crear una conexión de uso compartido seguro. Los datos compartidos simplemente están disponibles para el acceso en el área de trabajo. Si es necesario, un miembro del equipo configura un control de acceso granular en esos datos.
En el modelo de uso compartido abierto, puede usar cualquier herramienta que quiera (incluido Databricks) para acceder a los datos compartidos. El proveedor de datos le envía una dirección URL de activación a través de un canal seguro. Sígalo para descargar un archivo de credenciales que le permita acceder a los datos compartidos con usted.
Databricks no proporciona directamente los datos compartidos, sino que estos los proporcionan los proveedores de datos que se ejecutan en Azure Databricks.
Nota:
Databricks puede recopilar información sobre el uso y el acceso de los destinatarios de datos a los datos compartidos (incluida la identificación de cualquier persona o empresa que acceda a los datos mediante el archivo de credenciales en relación con dicha información) y puede compartirla con el proveedor de datos aplicable.
Obtener acceso a los datos compartidos con usted
La forma de acceder a los datos depende de si el proveedor de datos ha compartido datos con usted mediante el protocolo de uso compartido abierto o el protocolo de uso compartido de Databricks a Databricks. Consulte Uso compartido de Databricks a Databricks y uso compartido abierto.
Obtener acceso en el modelo de Databricks a Databricks
En el modelo de Databricks a Databricks:
El proveedor de datos le envía instrucciones para buscar un identificador único para el metastore del Unity Catalog asociado al área de trabajo de Databricks y enviárselo.
El identificador de uso compartido es una cadena formada por la nube del metastore, la región y el UUID (identificador único del metastore), con el formato
<cloud>:<region>:<uuid>
. Por ejemplo,aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef
.Para obtener el identificador de uso compartido mediante Catalog Explorer:
En el área de trabajo de Azure Databricks, haga clic en Catálogo.
En la parte superior del panel Catálogo, haga clic en el icono del engranaje de y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
- En la pestaña Compartidos conmigo, haga clic en el nombre de la organización de uso compartido de Databricks en la zona superior derecha y seleccione Copiar identificador de uso compartido.
Para obtener el identificador de uso compartido mediante un cuaderno o una consulta de Databricks SQL, use la función SQL predeterminada
CURRENT_METASTORE
. Si usa un cuaderno, debe ejecutarse en un clúster de usuario compartido o único en el área de trabajo que usará para acceder a los datos compartidos.SELECT CURRENT_METASTORE();
El proveedor de datos crea:
- Un destinatario en su cuenta de Databricks para representarle a usted y a los usuarios de su organización que tendrán acceso a los datos.
- Un recurso compartido, que es una representación de las tablas, volúmenes y vistas que se van a compartir con usted.
Puede acceder a los datos compartidos con usted. Usted o alguien del equipo pueden, si es necesario, configurar el acceso a datos pormenorizado en esos datos para los usuarios. Consulte Lectura de datos compartidos mediante el uso de Delta de Databricks a Databricks Delta Sharing (para destinatarios).
Obtener acceso en el modelo de uso compartido abierto
En el modelo de uso compartido abierto:
El proveedor de datos crea:
- Un destinatario en su cuenta de Databricks para representarle a usted y a los usuarios de su organización que tendrán acceso a los datos. Un token y un archivo de credenciales se generan como parte de esta configuración.
- Un recurso compartido, que es una representación de las tablas y particiones que se van a compartir con usted.
El proveedor de datos le envía una dirección URL de activación a través de un canal seguro. Sígalo para descargar un archivo de credenciales que le permita acceder a los datos compartidos con usted.
Importante
No comparta el vínculo de activación con nadie. Puede descargar un archivo de credenciales solo una vez. Si vuelve a visitar el vínculo de activación después de haber descargado el archivo de credenciales, el botón Descargar archivo de credenciales se deshabilita.
Si pierde el vínculo de activación antes de usarlo, póngase en contacto con el proveedor de datos.
Almacene el archivo de credenciales en una ubicación segura.
No comparta el archivo de credenciales con nadie fuera del grupo de usuarios que deberían tener acceso a los datos compartidos. Si necesita compartirlo con alguien de su organización, Databricks recomienda usar un administrador de contraseñas.
Lectura de los datos compartidos
La forma de leer los datos que se han compartido de forma segura con Delta Sharing depende de si recibió un archivo de credenciales (el modelo de uso compartido abierto) o si usa un área de trabajo de Databricks y proporcionó al proveedor de datos el identificador de uso compartido (el modelo de Databricks a Databricks).
Leer datos compartidos mediante un archivo de credenciales (uso compartido abierto)
Si los datos se han compartido con usted mediante el protocolo de uso compartido abierto de Delta Sharing, use el archivo de credenciales que descargó para autenticarse en la cuenta de Databricks del proveedor de datos y leer los datos compartidos. El acceso persiste siempre y cuando el token subyacente sea válido y el proveedor siga compartiendo los datos. Los proveedores administran la expiración y la rotación del token. Las actualizaciones de los datos están disponibles casi en tiempo real. Puede leer y realizar copias de los datos compartidos, pero no puede modificar los datos de origen.
Para obtener información sobre cómo acceder a los datos compartidos y leerlos mediante el archivo de credenciales de Azure Databricks, Apache Spark, pandas y Power BI, consulte Lectura de datos compartidos mediante uso compartido abierto de Delta Sharing (para destinatarios).
Lectura de datos compartidos mediante el uso compartido de Databricks a Databricks
Si los datos se han compartido con usted mediante el modelo de Databricks a Databricks, no se requiere ningún archivo de credenciales para acceder a los datos compartidos. Databricks se encarga de la conexión segura y los datos compartidos se pueden detectar automáticamente en el área de trabajo de Databricks.
Para aprender a buscar, leer y administrar esos datos compartidos en el área de trabajo de Databricks, consulte Lectura de datos compartidos mediante Databricks a Databricks de Delta Sharing (para destinatarios).
Auditar el uso de datos compartidos
Si tiene acceso a un área de trabajo de Azure Databricks, puede usar los registros de auditoría de Azure Databricks para comprender quién tiene acceso a los datos que usan Delta Sharing. Consulte Auditoría y supervisión del uso compartido de datos.