Ausführen von Notebooks in Reinräumen
Wichtig
Dieses Feature befindet sich in der Public Preview.
In diesem Artikel wird beschrieben, wie Notebooks in Reinräumen ausgeführt werden. Notebooks sind die Schnittstelle, die Mitarbeiter zum gemeinsamen Durchführen von Datenanalysen verwenden.
Weitere Informationen zum Hinzufügen eines Notebooks zu einem Reinraum finden Sie unter Erstellen von Reinräumen.
Voraussetzungen
Um ein Notebook in einem Reinraum auszuführen, müssen Sie Folgendes sein:
- Der Besitzer des Reinraums, oder Sie verfügen über die
EXECUTE CLEAN ROOM TASK
-Berechtigung für den Reinraum - Ein Mitarbeiter, der das Notebook nicht erstellt hat. Der Ersteller des Notebooks kann es nicht ausführen. Dadurch wird die implizite Genehmigung des Notebooks durch beide Parteien erzwungen.
Hinweis
Der Ersteller wird im Databricks-Konto automatisch als Besitzer des Reinraums zugewiesen. Dem Metastore-Administrator der Organisation des Projektmitarbeiters wird im Databricks-Konto automatisch der Besitz des Reinraums zugewiesen. Sie können den Besitz übertragen. Weitere Informationen finden Sie unter Verwalten des Unity Catalog-Objektbesitzes.
Ausführen eines Notebooks in einem Reinraum
Um ein Notebook in einem Reinraum auszuführen, müssen Sie den Katalog-Explorer verwenden.
Klicken Sie in Ihrem Azure Databricks-Arbeitsbereich auf Katalog.
Klicken Sie oben im Bereich Katalog auf das Zahnradsymbol , und wählen Sie Reinräume aus.
Alternativ können Sie auf der Seite Schnellzugriff auf die Schaltfläche Reinräume > klicken.
Wählen Sie den Reinraum in der Liste aus.
Klicken Sie unter Notebooks auf das Notebook, um es im Vorschaumodus zu öffnen.
Klicken Sie auf Ausführen.
Sie können nur Notebooks ausführen, die der andere Mitarbeiter freigegeben hat.
(Optional) Klicken Sie im Dialogfeld "Notizbuch ausführen" mit Parametern auf +Hinzufügen , um Parameterwerte an die Aufgabe des Notizbuchauftrags zu übergeben.
Weitere Informationen zu Parametern für Auftragsaufgaben finden Sie unter Parametrisieren von Aufträgen.
Aktivieren Sie das Kontrollkästchen zur Bestätigung.
Klicken Sie auf Ausführen.
Klicken Sie auf Details anzeigen, um den Fortschritt der Ausführung anzuzeigen.
Alternativ können Sie den Ausführungsfortschritt anzeigen, indem Sie auf dieser Seite zu Ausführungen wechseln oder auf der Randleiste des Arbeitsbereichs auf Workflows klicken und zur Registerkarte Auftragsausführungen wechseln.
Zeigen Sie die Ergebnisse der Notebookausführung an.
Die Notebookergebnisse werden nach Abschluss der Ausführung angezeigt. Um vergangene Ausführungen anzuzeigen, wechseln Sie zu Ausführungen, und klicken Sie in der Spalte Startzeit auf den Link.
Freigeben der Notizbuchausgabe mithilfe von Ausgabetabellen
Ausgabetabellen sind temporäre schreibgeschützte Tabellen, die von einer Notizbuchausführung generiert und für den Metaspeicher des Läufers freigegeben werden. Wenn das Notizbuch eine Ausgabetabelle erstellt, kann der Notizbuchläufer in einem Ausgabekatalog darauf zugreifen und mit anderen Benutzern in ihrem Arbeitsbereich teilen. Siehe Erstellen und Arbeiten mit Ausgabetabellen in Databricks Clean Rooms.
Verwenden von Azure Databricks-Workflows zum Ausführen von Reinraumnotizbüchern
Sie können Azure Databricks-Aufträge verwenden, um Notizbücher auszuführen und Aufgaben für Ausgabetabellen auszuführen, sodass Sie komplexe Workflows erstellen können, die Ihre Reinraumressourcen umfassen. Diese Features ermöglichen insbesondere solche Workflows:
- Mit dem Aufgabentyp "Notizbuch bereinigen" können Sie ein Notizbuch für reinen Raum als Workflow-Aufgabe auswählen und ausführen. Informationen zu Aufträgen finden Sie unter Notizbuch-Aufgabe "Clean Room".
- Workflowgesteuerte Notizbuchausführungen können Ausgabetabellen generieren, auf die von anderen Workflowaufgaben verwiesen werden kann. Siehe Erstellen und Arbeiten mit Ausgabetabellen in Databricks Clean Rooms.
- Workflows können Aufgabenwerte verwenden, die Auftragsparameterwerte zum Bereinigen von Raumnotizbüchern übergeben oder die Ausgabe des Reinraumnotizbuchs erfassen und diese Ausgabe an andere Workflowaufgaben übergeben. Siehe Verwenden von Aufgabenwerten zur Weitergabe von Informationen zwischen Aufgaben..
Sie können z. B. einen Workflow erstellen, der den dynamisch generierten Ausgabeschemanamen über Aufgaben hinweg verteilt, indem Sie die folgenden Schritte ausführen:
Erstellen Sie ein Aufgaben-Notizbuch vom Typ "Clean Rooms", das ein Notizbuch ausführt, das die folgende Einstellung für aufgabenwert enthält:
dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
Erstellen Sie eine nachfolgende Aufgabe, die auf den
output_schema
Wert verweist, um die Ausgabe zu verarbeiten.