Ejecución de cuadernos en salas limpias
Importante
Esta característica está en versión preliminar pública.
En este artículo se describe cómo ejecutar cuadernos en salas limpias. Los cuadernos son la interfaz que usan los colaboradores para ejecutar el análisis de datos en colaboración.
Para obtener información sobre cómo agregar un bloc de notas a una sala limpia, consulte Crear salas limpias.
Antes de empezar
Para ejecutar un cuaderno en una sala limpia, debe ser:
- El propietario de la sala limpia o tener el privilegio
EXECUTE CLEAN ROOM TASK
en la sala limpia. - Colaborador que no creó el cuaderno. El creador del cuaderno no puede ejecutar el cuaderno. Esto exige la aprobación implícita del cuaderno por ambas partes.
Nota:
El creador se asigna automáticamente como propietario de la sala limpia en su cuenta de Databricks. El administrador de metastore de la organización colaborador se asigna automáticamente la propiedad de la sala limpia en su cuenta de Databricks. Puede transferir la propiedad. Consulte Administración de la propiedad de objetos de Unity Catalog.
Ejecutar un cuaderno en una sala limpia
Para ejecutar un cuaderno en una sala limpia, debe usar el Explorador de catálogos.
En el área de trabajo de Azure Databricks, haga clic en Catálogo.
En la parte superior del panel Catálogo, haga clic en el icono del engranaje de y seleccione Salas limpias.
Como alternativa, en la página Acceso rápido, haga clic en el botón Salas limpias >.
Seleccione la sala limpia de la lista.
En Cuadernos, haga clic en el cuaderno para abrirlo en modo de vista previa.
Haga clic en el botón Ejecutar.
Solo puede ejecutar cuadernos que el otro colaborador haya compartido.
(Opcional) En el cuadro de diálogo Ejecutar cuaderno con parámetros , haga clic en + Agregar para pasar valores de parámetro a la tarea de trabajo del cuaderno.
Para más información sobre los parámetros de las tareas de trabajo, consulte Parametrización de trabajos.
Haga clic en la casilla de confirmación.
Haga clic en Ejecutar.
Haga clic en Ver detalles para ver el progreso de la ejecución.
Como alternativa, puede ver el progreso de la ejecución; para ello, vaya a Ejecuciones en esta página o haga clic en Flujos de trabajo en la barra lateral del área de trabajo y vaya a la pestaña Ejecuciones del trabajo.
Vea los resultados de la ejecución del cuaderno.
Los resultados del cuaderno aparecen una vez completada la ejecución. Para ver las ejecuciones anteriores, vaya a Ejecuciones y haga clic en el vínculo de la columna Hora de inicio.
Uso compartido de la salida del cuaderno mediante tablas de salida
Las tablas de salida son tablas de solo lectura temporales generadas por una ejecución de cuaderno y compartidas en el metastore del ejecutor de cuadernos. Si el cuaderno crea una tabla de salida, el ejecutor de cuadernos puede acceder a ella en un catálogo de salida y compartirla con otros usuarios de su área de trabajo. Consulte Creación y trabajo con tablas de salida en Salas limpias de Databricks.
Uso de flujos de trabajo de Azure Databricks para ejecutar cuadernos de salas limpias
Puede usar trabajos de Azure Databricks para ejecutar cuadernos y realizar tareas en tablas de salida, lo que le permite crear flujos de trabajo complejos que impliquen los recursos de sala limpia. Estas características en particular hacen que estos flujos de trabajo sean posibles:
- El tipo de tarea Clean Room Notebook permite seleccionar y ejecutar un cuaderno de sala limpia como tarea Flujos de trabajo. Consulte Limpieza de la tarea bloc de notas de sala para ver los trabajos.
- Las ejecuciones de cuadernos iniciadas por el flujo de trabajo pueden generar tablas de salida a las que pueden hacer referencia otras tareas de flujo de trabajo. Consulte Creación y trabajo con tablas de salida en Salas limpias de Databricks.
- Los flujos de trabajo pueden usar valores de tarea que pasan valores de parámetros de trabajo para limpiar cuadernos de sala o capturar la salida del cuaderno de sala limpia y pasar esa salida a otras tareas de flujo de trabajo. Consulte Use task values to pass information between tasks (Uso de valores de tareas para pasar información entre tareas).
Por ejemplo, puede crear un flujo de trabajo que propague el nombre del esquema de salida generado dinámicamente entre tareas, haciendo lo siguiente:
Cree una tarea de tipo tarea Clean Rooms notebook que ejecute un cuaderno que incluya la siguiente configuración de valor de tarea:
dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
Cree una tarea posterior que haga referencia al
output_schema
valor para procesar la salida.