Compartir a través de


Ejecución de cuadernos en salas limpias

Importante

Esta característica está en versión preliminar pública.

En este artículo se describe cómo ejecutar cuadernos en salas limpias. Los cuadernos son la interfaz que usan los colaboradores para ejecutar el análisis de datos en colaboración.

Para obtener información sobre cómo agregar un bloc de notas a una sala limpia, consulte Crear salas limpias.

Antes de empezar

Para ejecutar un cuaderno en una sala limpia, debe ser:

  • El propietario de la sala limpia o tener el privilegio EXECUTE CLEAN ROOM TASK en la sala limpia.
  • Colaborador que no creó el cuaderno. El creador del cuaderno no puede ejecutar el cuaderno. Esto exige la aprobación implícita del cuaderno por ambas partes.

Nota:

El creador se asigna automáticamente como propietario de la sala limpia en su cuenta de Databricks. El administrador de metastore de la organización colaborador se asigna automáticamente la propiedad de la sala limpia en su cuenta de Databricks. Puede transferir la propiedad. Consulte Administración de la propiedad de objetos de Unity Catalog.

Ejecutar un cuaderno en una sala limpia

Para ejecutar un cuaderno en una sala limpia, debe usar el Explorador de catálogos.

  1. En el área de trabajo de Azure Databricks, haga clic en Icono de catálogo Catálogo.

  2. En la parte superior del panel Catálogo, haga clic en el icono del engranaje de icono de engranaje y seleccione Salas limpias.

    Como alternativa, en la página Acceso rápido, haga clic en el botón Salas limpias >.

  3. Seleccione la sala limpia de la lista.

  4. En Cuadernos, haga clic en el cuaderno para abrirlo en modo de vista previa.

  5. Haga clic en el botón Ejecutar.

    Solo puede ejecutar cuadernos que el otro colaborador haya compartido.

  6. (Opcional) En el cuadro de diálogo Ejecutar cuaderno con parámetros , haga clic en + Agregar para pasar valores de parámetro a la tarea de trabajo del cuaderno.

    Para más información sobre los parámetros de las tareas de trabajo, consulte Parametrización de trabajos.

  7. Haga clic en la casilla de confirmación.

  8. Haga clic en Ejecutar.

  9. Haga clic en Ver detalles para ver el progreso de la ejecución.

    Como alternativa, puede ver el progreso de la ejecución; para ello, vaya a Ejecuciones en esta página o haga clic en Flujos de trabajo en la barra lateral del área de trabajo y vaya a la pestaña Ejecuciones del trabajo.

  10. Vea los resultados de la ejecución del cuaderno.

    Los resultados del cuaderno aparecen una vez completada la ejecución. Para ver las ejecuciones anteriores, vaya a Ejecuciones y haga clic en el vínculo de la columna Hora de inicio.

Uso compartido de la salida del cuaderno mediante tablas de salida

Las tablas de salida son tablas de solo lectura temporales generadas por una ejecución de cuaderno y compartidas en el metastore del ejecutor de cuadernos. Si el cuaderno crea una tabla de salida, el ejecutor de cuadernos puede acceder a ella en un catálogo de salida y compartirla con otros usuarios de su área de trabajo. Consulte Creación y trabajo con tablas de salida en Salas limpias de Databricks.

Uso de flujos de trabajo de Azure Databricks para ejecutar cuadernos de salas limpias

Puede usar trabajos de Azure Databricks para ejecutar cuadernos y realizar tareas en tablas de salida, lo que le permite crear flujos de trabajo complejos que impliquen los recursos de sala limpia. Estas características en particular hacen que estos flujos de trabajo sean posibles:

Por ejemplo, puede crear un flujo de trabajo que propague el nombre del esquema de salida generado dinámicamente entre tareas, haciendo lo siguiente:

  1. Cree una tarea de tipo tarea Clean Rooms notebook que ejecute un cuaderno que incluya la siguiente configuración de valor de tarea:

    dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
    
  2. Cree una tarea posterior que haga referencia al output_schema valor para procesar la salida.