Freigeben über


Ausführen von Notebooks in Reinräumen

Wichtig

Dieses Feature befindet sich in der Public Preview.

In diesem Artikel wird beschrieben, wie Notebooks in Reinräumen ausgeführt werden. Notebooks sind die Schnittstelle, die Mitarbeiter zum gemeinsamen Durchführen von Datenanalysen verwenden.

Weitere Informationen zum Hinzufügen eines Notebooks zu einem Reinraum finden Sie unter Erstellen von Reinräumen.

Voraussetzungen

Um ein Notebook in einem Reinraum auszuführen, müssen Sie Folgendes sein:

  • Der Besitzer des Reinraums, oder Sie verfügen über die EXECUTE CLEAN ROOM TASK-Berechtigung für den Reinraum
  • Ein Mitarbeiter, der das Notebook nicht erstellt hat. Der Ersteller des Notebooks kann es nicht ausführen. Dadurch wird die implizite Genehmigung des Notebooks durch beide Parteien erzwungen.

Hinweis

Der Ersteller wird im Databricks-Konto automatisch als Besitzer des Reinraums zugewiesen. Dem Metastore-Administrator der Organisation des Projektmitarbeiters wird im Databricks-Konto automatisch der Besitz des Reinraums zugewiesen. Sie können den Besitz übertragen. Weitere Informationen finden Sie unter Verwalten des Unity Catalog-Objektbesitzes.

Ausführen eines Notebooks in einem Reinraum

Um ein Notebook in einem Reinraum auszuführen, müssen Sie den Katalog-Explorer verwenden.

  1. Klicken Sie in Ihrem Azure Databricks-Arbeitsbereich auf Symbol „Katalog“ Katalog.

  2. Klicken Sie oben im Bereich Katalog auf das Zahnradsymbol Zahnradsymbol, und wählen Sie Reinräume aus.

    Alternativ können Sie auf der Seite Schnellzugriff auf die Schaltfläche Reinräume > klicken.

  3. Wählen Sie den Reinraum in der Liste aus.

  4. Klicken Sie unter Notebooks auf das Notebook, um es im Vorschaumodus zu öffnen.

  5. Klicken Sie auf Ausführen.

    Sie können nur Notebooks ausführen, die der andere Mitarbeiter freigegeben hat.

  6. (Optional) Klicken Sie im Dialogfeld "Notizbuch ausführen" mit Parametern auf +Hinzufügen , um Parameterwerte an die Aufgabe des Notizbuchauftrags zu übergeben.

    Weitere Informationen zu Parametern für Auftragsaufgaben finden Sie unter Parametrisieren von Aufträgen.

  7. Aktivieren Sie das Kontrollkästchen zur Bestätigung.

  8. Klicken Sie auf Ausführen.

  9. Klicken Sie auf Details anzeigen, um den Fortschritt der Ausführung anzuzeigen.

    Alternativ können Sie den Ausführungsfortschritt anzeigen, indem Sie auf dieser Seite zu Ausführungen wechseln oder auf der Randleiste des Arbeitsbereichs auf Workflows klicken und zur Registerkarte Auftragsausführungen wechseln.

  10. Zeigen Sie die Ergebnisse der Notebookausführung an.

    Die Notebookergebnisse werden nach Abschluss der Ausführung angezeigt. Um vergangene Ausführungen anzuzeigen, wechseln Sie zu Ausführungen, und klicken Sie in der Spalte Startzeit auf den Link.

Freigeben der Notizbuchausgabe mithilfe von Ausgabetabellen

Ausgabetabellen sind temporäre schreibgeschützte Tabellen, die von einer Notizbuchausführung generiert und für den Metaspeicher des Läufers freigegeben werden. Wenn das Notizbuch eine Ausgabetabelle erstellt, kann der Notizbuchläufer in einem Ausgabekatalog darauf zugreifen und mit anderen Benutzern in ihrem Arbeitsbereich teilen. Siehe Erstellen und Arbeiten mit Ausgabetabellen in Databricks Clean Rooms.

Verwenden von Azure Databricks-Workflows zum Ausführen von Reinraumnotizbüchern

Sie können Azure Databricks-Aufträge verwenden, um Notizbücher auszuführen und Aufgaben für Ausgabetabellen auszuführen, sodass Sie komplexe Workflows erstellen können, die Ihre Reinraumressourcen umfassen. Diese Features ermöglichen insbesondere solche Workflows:

Sie können z. B. einen Workflow erstellen, der den dynamisch generierten Ausgabeschemanamen über Aufgaben hinweg verteilt, indem Sie die folgenden Schritte ausführen:

  1. Erstellen Sie ein Aufgaben-Notizbuch vom Typ "Clean Rooms", das ein Notizbuch ausführt, das die folgende Einstellung für aufgabenwert enthält:

    dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
    
  2. Erstellen Sie eine nachfolgende Aufgabe, die auf den output_schema Wert verweist, um die Ausgabe zu verarbeiten.