Partager via


Exécuter des notebooks dans des salles blanches

Cet article décrit comment faire fonctionner des ordinateurs portables dans des salles blanches. Les notebooks sont l’interface que les collaborateurs utilisent pour exécuter l’analyse des données en collaboration.

Pour savoir comment ajouter un bloc-notes à une salle propre, consultez Créer des salles propres.

Avant de commencer

Pour exécuter un bloc-notes dans une salle propre, vous devez être :

  • Le propriétaire de la salle blanche ou le détenteur du EXECUTE CLEAN ROOM TASK privilège sur la salle blanche.
  • Collaborateur(-trice) qui n’a pas créé le bloc-notes. Le créateur du bloc-notes ne peut pas exécuter le bloc-notes. Cela applique l’approbation implicite du bloc-notes par les deux parties.

Remarque

Le créateur est automatiquement affecté comme propriétaire de la salle blanche dans son compte Databricks. L’administrateur(-trice) du metastore de l’organisation collaboratrice est automatiquement affecté comme propriétaire de la salle blanche dans son compte Databricks. Vous pouvez transférer la propriété. Consultez Gérer la propriété de l’objet Unity Catalog.

Exécuter un notebook dans une salle blanche

Pour exécuter un notebook dans une salle blanche, vous devez utiliser l’Explorateur de catalogues.

  1. Dans votre espace de travail Azure Databricks, cliquez sur icône CatalogueCatalogue.

  2. En haut du volet Catalog, cliquez sur l’icône d’engrenage icône Engrenage, puis sélectionnez Clean Rooms.

    Vous pouvez également, dans la page Quick access, cliquer sur le bouton Clean Rooms >.

  3. Sélectionnez la salle blanche dans la liste.

  4. Sous Notebooks, cliquez sur le bloc-notes pour l’ouvrir en mode Préversion.

  5. Cliquez sur le bouton Run.

    Vous ne pouvez exécuter que des notebooks partagés par l’autre collaborateur(-trice).

  6. (Facultatif) Dans la boîte de dialogue Exécuter le bloc-notes avec des paramètres , cliquez sur + Ajouter pour transmettre des valeurs de paramètre à la tâche de travail du bloc-notes.

  7. Cliquez sur la case de confirmation.

  8. Cliquez sur Exécuter.

  9. Cliquez sur Afficher les détails pour afficher la progression de l’exécution.

    Vous pouvez également afficher la progression de l’exécution en accédant à Exécutions sur cette page ou en cliquant sur flux de travail dans la barre latérale de l’espace de travail et en accédant à l’onglet Exécutions de travail.

  10. Afficher les résultats de l’exécution de notebook.

    Les résultats du bloc-notes s’affichent une fois l’exécution terminée. Pour afficher les exécutions passées, accédez à Exécutions, puis cliquez sur le lien dans la colonne Heure de début.

Remarque

Les paramètres cr_creator_input_catalog et cr_collaborator_input_catalog sont automatiquement passés dans le notebook de salle blanche pendant l’exécution. Vous pouvez utiliser ces paramètres pour les tests locaux avec des exemples de tables. Pour plus d’informations sur les paramètres des tâches de projet, consultez Définir les paramètres des projets.

Partager la sortie du bloc-notes à l’aide de tables de sortie

Les tables de sortie sont des tables en lecture seule temporaire générées par une exécution de notebook et partagées avec le metastore de l’exécuteur de notebooks. Si le bloc-notes crée une table de sortie, l’exécuteur de notebooks peut y accéder dans un catalogue de sorties et le partager avec d’autres utilisateurs de leur espace de travail. Consultez Créer et utiliser des tables de sortie dans Databricks Clean Rooms.

Utiliser des flux de travail Azure Databricks pour exécuter des notebooks de salle propre

Vous pouvez utiliser des travaux Azure Databricks pour exécuter des notebooks et effectuer des tâches sur des tables de sortie, ce qui vous permet de créer des flux de travail complexes qui impliquent vos ressources de salle propre. Ces fonctionnalités rendent notamment ces flux de travail possibles :

  • Le type de tâche bloc-notes Clean Room vous permet de sélectionner et d’exécuter un bloc-notes de salle propre en tant que tâche flux de travail. Consultez la tâche de bloc-notes Clean Room pour les travaux.
  • Les exécutions de notebook initiées par le flux de travail peuvent générer des tables de sortie qui peuvent être référencées par d’autres tâches de flux de travail. Consultez Créer et utiliser des tables de sortie dans Databricks Clean Rooms.
  • Les flux de travail peuvent utiliser des valeurs de tâche qui transmettent des valeurs de paramètre de travail aux blocs-notes de salle propre ou capturent la sortie du bloc-notes de salle propre et passent cette sortie à d’autres tâches de flux de travail. Consultez Utiliser les valeurs de tâche pour transférer des informations entre les tâches.
  • Le nom du schéma de sortie de salle blanche est généré automatiquement. Si vous incluez {{tasks.<your_task_name>.output.schema_name}} et {{tasks.<your_task_name>.output.catalog_name}} dans les paramètres, vous pouvez référencer ces valeurs à partir d’une salle blanche lors de son exécution dans une tâche de notebook en aval. Accédez à une tâche de bloc-notes, puis, sous Paramètres, sélectionnez vos valeurs.

Par exemple, vous pouvez créer un flux de travail qui propage le nom de schéma de sortie généré dynamiquement entre les tâches, en procédant comme suit :

  1. Créez une tâche de type Salles propres notebook qui exécute un bloc-notes qui inclut le paramètre de valeur de tâche suivant :

    dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
    
  2. Créez une tâche suivante qui référence la output_schema valeur pour traiter la sortie.