Crear salas limpias
Importante
Esta característica está en versión preliminar pública. Para solicitar acceso, póngase en contacto con su representante de Azure Databricks.
En este artículo se describe cómo crear una sala limpia, un entorno seguro y de protección de la privacidad en el que varias partes pueden trabajar conjuntamente en datos empresariales confidenciales sin acceso directo a los datos de los demás.
Antes de empezar
Los privilegios necesarios para usar salas limpias varían en función de la tarea:
Para crear una sala limpia, debe tener el privilegio
CREATE CLEAN ROOM
o ser un administrador de metastore. El creador se asigna automáticamente como propietario de la sala limpia en su metastore de Unity Catalog.Para iniciar la participación en una sala limpia que se comparte con usted, debe ser administrador de metastore.
Cuando se comparte una sala limpia, el administrador de metastore de la organización colabadoradora se asigna automáticamente como propietario de la sala limpia. El administrador de metastore puede reasignar la propiedad a un administrador que no sea de metastore. Como procedimiento recomendado de gobernanza de datos, Databricks recomienda asignar la propiedad a un grupo.
Si el área de trabajo no tiene asignado un administrador de metastore, debe asignar el rol. Consulte Asignar un administrador de metastore y Administrar propiedad del objeto de Unity Catalog.
Para agregar y quitar recursos de datos y cuadernos en una sala limpia, debe ser el propietario de la sala limpia o tener el privilegio
MODIFY CLEAN ROOM
en la sala limpia. Además, usted y el propietario de la sala limpia (si no es el propietario) deben tenerSELECT
en las tablas que agregue yREAD VOLUME
en los volúmenes que agregue.
Para obtener información sobre los requisitos de permisos para actualizar salas limpias y ejecutar tareas (cuadernos) en salas limpias, consulte Administrar salas limpias y Ejecutar cuadernos en salas limpias.
Puede crear hasta cinco salas limpias por metastore.
Paso 1. Solicitar el identificador de uso compartido del colaborador
Para poder crear una sala limpia, debe tener el identificador de uso compartido de sala limpia de la organización con la que colaborará. El identificador de uso compartido es una cadena que consta del identificador global de metastore de la organización + id. de área de trabajo + el nombre de usuario del contacto (dirección de correo electrónico). El colaborador puede estar en cualquier nube o región.
Póngase en contacto con el colaborador para solicitar su identificador de uso compartido.
El colaborador puede obtener el identificador de uso compartido mediante las instrucciones de Buscar el identificador de uso compartido.
Paso 2. Creación de una sala limpia
Para crear una sala limpia, debe usar el Explorador de catálogos.
En el área de trabajo de Azure Databricks, haga clic en Catálogo.
En la página Acceso rápido, haga clic en el botón Clean Rooms >.
Como alternativa, haga clic en el icono de engranaje en la parte superior del panel Catálogo y seleccione Salas limpias.
Haga clic en Crear sala limpia.
En la página Crear sala limpia, escriba un nombre descriptivo para la sala limpia.
El nombre no puede usar espacios, puntos ni barras diagonales (/).
No puede cambiar el nombre de la sala limpia una vez guardado. Use un nombre que el colaborador encuentre útil y descriptivo.
Seleccione el proveedor de nube y la región donde se creará la sala limpia central.
El proveedor de la nube debe ser el mismo que el área de trabajo actual, pero la región no. Considere la residencia de datos de su organización u otras directivas al realizar la selección.
(Opcional) Agregue un comentario.
Escriba el identificador de uso compartido de sala limpia del colaborador.
Consulte el Paso 1. Solicite el identificador de uso compartido del colaborador.
Anote los nombres de catálogo asignados (el creador) y el colaborador.
Todos los recursos de datos agregados a la sala limpia aparecerán en ese catálogo en la sala limpia central y se puede hacer referencia a ellos mediante ese catálogo en el espacio de nombres de tres niveles (
<catalog>.<schema>.<table-etc>
).Haga clic en Crear sala limpia.
Paso 3. Agregar recursos de datos y cuadernos a la sala limpia
Cualquiera de las partes de la sala limpia (el creador y el colaborador) puede agregar tablas, volúmenes y blocs de notas a la sala limpia.
Permisos necesarios:
Debe ser el propietario o tener el privilegio
MODIFY CLEAN ROOM
en la sala limpia.Usted y el propietario de la sala limpia (si no es el propietario) deben tener
SELECT
en cualquier tabla yREAD VOLUME
en cualquier volumen que agregue, junto conUSE CATALOG
yUSE SCHEMA
en el catálogo y el esquema primarios.El propietario de la sala limpia debe mantener estos privilegios durante toda la vida útil de la sala limpia.
Nota:
En las instrucciones siguientes se supone que vuelve a una sala limpia ya creada para agregar recursos. Si acaba de crear una sala limpia por primera vez, un asistente le guiará a través de la adición de recursos de datos y cuadernos. La interfaz de usuario real para agregar estos recursos es la misma, independientemente de si está guiada por el asistente o no.
Para agregar recursos:
En el área de trabajo de Azure Databricks, haga clic en Catálogo.
En la página Acceso rápido, haga clic en el botón Clean Rooms >.
Como alternativa, haga clic en el icono de engranaje en la parte superior del panel Catálogo y seleccione Salas limpias.
Busque y haga clic en el nombre de la sala limpia que desea actualizar.
Para agregar recursos de datos (tablas y volúmenes), haga clic en el botón + Agregar recursos de datos.
Seleccione las tablas y volúmenes que desea compartir y haga clic en Agregar recursos de datos.
Si comparte una tabla o volumen, puede agregar opcionalmente un alias. El nombre del alias será el único nombre visible en la sala limpia.
Al compartir una tabla, también puede agregar cláusulas de partición que le permitan compartir solo parte de la tabla. Para obtener más información sobre cómo usar particiones para limitar lo que comparte, consulte Especificar particiones de tabla para compartir.
Para agregar cuadernos, haga clic en el botón + Agregar cuadernos y busque el cuaderno que desea agregar.
Opcionalmente, puede asignar al cuaderno un nombre de cuaderno alternativo.
Los cuadernos que comparte en salas limpias consultan datos y ejecutan cargas de trabajo de análisis de datos en las tablas y volúmenes que usted y el otro colaborador han agregado a la sala limpia.
Los cuadernos funcionan con el principio de aprobación implícita: no se pueden ejecutar cuadernos que cree. Usted crea los cuadernos que usa su colaborador, y su colaborador crea los cuadernos que usted usa.
Si comparte un cuaderno que incluye resultados, esos resultados se compartirán con su colaborador.
Importante
Cualquier referencia de cuaderno a tablas o volúmenes que se hayan añadido a la sala limpia debe utilizar el nombre de catálogo asignado cuando se creó la sala limpia ("creador" para los recursos de datos añadidos por el creador de la sala limpia, y "colaborador" para los recursos de datos añadidos por el colaborador invitado). Por ejemplo, una tabla agregada por el creador podría denominarse
creator.sales.california
.Del mismo modo, asegúrese de que el cuaderno usa los alias asignados a los recursos de datos en la sala limpia.