Freigeben über


Ausführen von Notebooks in Reinräumen

In diesem Artikel wird beschrieben, wie Notebooks in Reinräumen ausgeführt werden. Notebooks sind die Schnittstelle, die Mitarbeiter zum gemeinsamen Durchführen von Datenanalysen verwenden.

Weitere Informationen zum Hinzufügen eines Notebooks zu einem Reinraum finden Sie unter Erstellen von Reinräumen.

Voraussetzungen

Um ein Notebook in einem Reinraum auszuführen, müssen Sie Folgendes sein:

  • Der Besitzer des Reinraums, oder Sie verfügen über die EXECUTE CLEAN ROOM TASK-Berechtigung für den Reinraum
  • Ein Mitarbeiter, der das Notebook nicht erstellt hat. Der Ersteller des Notebooks kann es nicht ausführen. Dadurch wird die implizite Genehmigung des Notebooks durch beide Parteien erzwungen.

Hinweis

Der Ersteller wird im Databricks-Konto automatisch als Besitzer des Reinraums zugewiesen. Dem Metastore-Administrator der Organisation des Projektmitarbeiters wird im Databricks-Konto automatisch der Besitz des Reinraums zugewiesen. Sie können den Besitz übertragen. Weitere Informationen finden Sie unter Verwalten des Unity Catalog-Objektbesitzes.

Ausführen eines Notebooks in einem Reinraum

Um ein Notebook in einem Reinraum auszuführen, müssen Sie den Katalog-Explorer verwenden.

  1. Klicken Sie in Ihrem Azure Databricks-Arbeitsbereich auf Symbol „Katalog“Katalog.

  2. Klicken Sie oben im Bereich Katalog auf das Zahnradsymbol Zahnradsymbol, und wählen Sie Reinräume aus.

    Alternativ können Sie auf der Seite Schnellzugriff auf die Schaltfläche Reinräume > klicken.

  3. Wählen Sie den Reinraum in der Liste aus.

  4. Klicken Sie unter Notebooks auf das Notebook, um es im Vorschaumodus zu öffnen.

  5. Klicken Sie auf Ausführen.

    Sie können nur Notebooks ausführen, die der andere Mitarbeiter freigegeben hat.

  6. (Optional) Klicken Sie im Dialogfeld "Notizbuch ausführen" mit Parametern auf +Hinzufügen , um Parameterwerte an die Aufgabe des Notizbuchauftrags zu übergeben.

  7. Aktivieren Sie das Kontrollkästchen zur Bestätigung.

  8. Klicken Sie auf Ausführen.

  9. Klicken Sie auf Details anzeigen, um den Fortschritt der Ausführung anzuzeigen.

    Alternativ können Sie den Ausführungsfortschritt anzeigen, indem Sie auf dieser Seite zu Ausführungen wechseln oder auf der Randleiste des Arbeitsbereichs auf Workflows klicken und zur Registerkarte Auftragsausführungen wechseln.

  10. Zeigen Sie die Ergebnisse der Notebookausführung an.

    Die Notebookergebnisse werden nach Abschluss der Ausführung angezeigt. Um vergangene Ausführungen anzuzeigen, wechseln Sie zu Ausführungen, und klicken Sie in der Spalte Startzeit auf den Link.

Hinweis

Die Parameter cr_creator_input_catalog und cr_collaborator_input_catalog werden während der Laufzeit automatisch an das Clean-Room-Notizbuch übergeben. Sie können diese Parameter für lokale Tests mit Beispieltabellen verwenden. Weitere Informationen zu Parametern für Auftragsaufgaben finden Sie unter Parametrisieren von Aufträgen.

Freigeben der Notizbuchausgabe mithilfe von Ausgabetabellen

Ausgabetabellen sind temporäre schreibgeschützte Tabellen, die von einer Notizbuchausführung generiert und für den Metaspeicher des Läufers freigegeben werden. Wenn das Notizbuch eine Ausgabetabelle erstellt, kann der Notizbuchläufer in einem Ausgabekatalog darauf zugreifen und mit anderen Benutzern in ihrem Arbeitsbereich teilen. Siehe Erstellen und Arbeiten mit Ausgabetabellen in Databricks Clean Rooms.

Verwenden von Azure Databricks-Workflows zum Ausführen von Reinraumnotizbüchern

Sie können Azure Databricks-Aufträge verwenden, um Notizbücher auszuführen und Aufgaben für Ausgabetabellen auszuführen, sodass Sie komplexe Workflows erstellen können, die Ihre Reinraumressourcen umfassen. Diese Features ermöglichen insbesondere solche Workflows:

  • Mit dem Aufgabentyp "Notizbuch bereinigen" können Sie ein Notizbuch für reinen Raum als Workflow-Aufgabe auswählen und ausführen. Informationen zu Aufträgen finden Sie unter Notizbuch-Aufgabe "Clean Room".
  • Workflowgesteuerte Notizbuchausführungen können Ausgabetabellen generieren, auf die von anderen Workflowaufgaben verwiesen werden kann. Siehe Erstellen und Arbeiten mit Ausgabetabellen in Databricks Clean Rooms.
  • Workflows können Aufgabenwerte verwenden, die Auftragsparameterwerte zum Bereinigen von Raumnotizbüchern übergeben oder die Ausgabe des Reinraumnotizbuchs erfassen und diese Ausgabe an andere Workflowaufgaben übergeben. Siehe Verwenden von Aufgabenwerten zur Weitergabe von Informationen zwischen Aufgaben..
  • Der Name des Reinraum-Ausgabeschemas wird automatisch generiert. Wenn Sie {{tasks.<your_task_name>.output.schema_name}} und {{tasks.<your_task_name>.output.catalog_name}} in die Parameter einschließen, können Sie auf diese Werte aus einem Reinraum verweisen, wenn er in einer nachgeschalteten Notebook-Task ausgeführt wird. Wechseln Sie zu einer Notizbuchaufgabe, und wählen Sie unter ParameterIhre Werte aus.

Sie können z. B. einen Workflow erstellen, der den dynamisch generierten Ausgabeschemanamen über Aufgaben hinweg verteilt, indem Sie die folgenden Schritte ausführen:

  1. Erstellen Sie ein Aufgaben-Notizbuch vom Typ "Clean Rooms", das ein Notizbuch ausführt, das die folgende Einstellung für aufgabenwert enthält:

    dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
    
  2. Erstellen Sie eine nachfolgende Aufgabe, die auf den output_schema Wert verweist, um die Ausgabe zu verarbeiten.