Freigeben über


Erstellen und Arbeiten mit Ausgabetabellen in Databricks Clean Rooms

Wichtig

Dieses Feature befindet sich in der Public Preview.

In diesem Artikel werden Ausgabetabellen vorgestellt, bei denen es sich um temporäre schreibgeschützte Tabellen handelt, die von einer Notizbuchausführung generiert und für den Unity-Katalog-Metaspeicher des Notizbuchläufers freigegeben werden. In diesem Artikel wird beschrieben, wie Sie mithilfe eines Notizbuchs Ausgabetabellen erstellen und wie Mitarbeiter diese Ausgabetabellen im Unity Catalog-Metaspeicher lesen können.

Übersicht über Ausgabetabellen

Mithilfe von Ausgabetabellen können Sie die Ausgabe von Notizbüchern, die in einem reinen Raum ausgeführt werden, in einem Ausgabekatalog im Unity-Katalog-Metaspeicher speichern, in dem Sie die Daten mitgliedern Ihres Teams zur Verfügung stellen können, die nicht in der Lage sind, die Notizbücher selbst auszuführen. Sie können auch Azure Databricks-Aufträge verwenden, um Notizbücher auszuführen und Aufgaben für Ausgabetabellen auszuführen. In Kombination mit dem Aufgabentyp des Clean Room-Notizbuchs und der Unterstützung für Aufgabenwerte können Sie mit Ausgabetabellen komplexe Workflows erstellen, die von Notizbüchern für Reinräume abhängen.

Ausgabetabellen sind schreibgeschützt.

Nur der bestimmte Prinzipal (Benutzer, Gruppe oder Dienstprinzipal), der das Notizbuch ausführt, verfügt über Standardlesezugriff auf die Ausgabetabelle. Es ist kein Schreibzugriff vorhanden. Ein Metastore-Administrator kann lesezugriff auf andere Prinzipale in ihrem Azure Databricks-Konto gewähren, wobei standardrechte für den Unity-Katalog verwendet werden.

Ausgabetabellen werden 30 Tage lang im Standardspeicherort des zentralen Reinraums gespeichert und mithilfe der Delta-Freigabe für den Metastore des Mitarbeiters freigegeben. Wenn Sie eine Ausgabetabelle länger als 30 Tage aufbewahren möchten, müssen Sie sie in den lokalen Speicher kopieren.

Jedes ausgeführte Notizbuch erstellt ein neues Schema im Ausgabekatalog. Neue Läufe können keine vorhandene Ausgabetabelle anfügen.

Wichtig

Ausgabetabellen werden nur unterstützt, wenn der zentrale Reinraum in AWS gehostet wird. Mitarbeiter in Databricks in allen drei Clouds – AWS, Azure und Google Cloud – können jedoch Notizbücher freigeben, die Ausgabetabellen erstellen und Ausgabetabellen lesen können, die generiert werden, wenn sie freigegebene Notizbücher ausführen. Google Cloud-Mitarbeiter müssen Teilnehmer in der privaten Vorschau von Clean Rooms sein.

Erstellen einer Ausgabetabelle

Verwenden Sie zum Erstellen einer Ausgabetabelle die Parameter cr_output_catalog und cr_output_schema den dreiteiligen Tabellennamespace. Jede Ausführung des Notizbuchs erzeugt ein neues Schema.

Im folgenden Beispiel erstellt die Notizbuchzelle eine Ausgabetabelle, die im Ausgabekatalog des Collborators aufgerufen overlapping_users wird, in der die Benutzer aufgelistet sind, deren E-Mail-Adresse sowohl in den als collaborator.advertiser.profiles auch in den creator.publisher.profiles Tabellen angezeigt wird.

CREATE TABLE identifier(:cr_output_catalog || '.' || :cr_output_schema || '.overlapping_users') AS
SELECT collab_profiles.*
FROM collaborator.advertiser.profiles AS collab_profiles
JOIN creator.publisher.profiles AS creator_profiles
ON collab_profiles.email = creator_profiles.email

Lesen einer Ausgabetabelle

Ausgabetabellen werden in einem freigegebenen Katalog im Metastore des Notizbuchläufers angezeigt. Im Katalog-Explorer-Katalogbereich werden sie in der Liste "Freigegebene Kataloge" angezeigt.

Das Lesen einer Ausgabetabelle ähnelt dem Lesen einer anderen Tabelle im Unity-Katalog. Sie müssen SELECT sich auf der Tabelle, USE CATALOG im freigegebenen Ausgabekatalog und USE SCHEMA im automatisch generierten Schema befinden. Der Benutzer, der das Notizbuch ausgeführt hat, das die Tabelle erstellt hat, verfügt standardmäßig über diese Berechtigungen.

Vorbemerkungen

In diesem Abschnitt werden Cloud-, Konfigurations- und Computeanforderungen für das Lesen von Ausgabetabellen beschrieben.

Cloudanforderungen

Während sich der zentrale Reinraum auf AWS befinden muss, um Ausgabetabellen zu unterstützen, können Mitarbeiterarbeitsbereiche in einer der drei Clouds sein: AWS, Azure oder Google Cloud. Google Cloud-Mitarbeiter müssen Teilnehmer in der privaten Vorschau von Clean Rooms sein.

Anforderung des freigegebenen Ausgabekatalogs

Bevor Sie Ausgabetabellen lesen können, muss ein Benutzer den Katalog erstellen, der sie enthält. Sie müssen dies nur einmal pro Reinraum tun.

Erforderliche Berechtigungen:EXECUTE_CLEAN_ROOM_TASK

  1. Klicken Sie in Ihrem Azure Databricks-Arbeitsbereich auf Symbol „Katalog“Katalog.
  2. Klicken Sie auf der Seite Schnellzugriff auf die Schaltfläche Reinräume >.
  3. Wählen Sie den Reinraum in der Liste aus.
  4. Klicken Sie im rechten Bereich unter "Ausgabe" auf " Katalog erstellen".
  5. Geben Sie einen Ausgabekatalognamen ein, oder akzeptieren Sie den Standardwert.<clean-room-name>_output

Der Ausgabekatalog wird in der Liste der freigegebenen Kataloge im Katalog-Explorer-Katalogbereich angezeigt. Jeder reinen Raum, an dem Sie teilnehmen, kann über einen freigegebenen Ausgabekatalog in Ihrem Metastore verfügen.

Computeanforderungen

Abfragen für Ausgabetabellen erfordern eine serverlose Berechnung. Weitere Informationen finden Sie unter Herstellen einer Verbindung mit serverlosem Compute.

Zum Lesen einer Ausgabetabelle erforderliche Berechtigungen

Der Benutzer, der das Notizbuch ausgeführt hat, das die Ausgabetabelle erstellt hat, verfügt standardmäßig über die Berechtigung zum Lesen aus der Ausgabetabelle. Alle anderen Benutzer müssen über die folgenden Berechtigungen verfügen, die ihnen gewährt werden:

  • SELECT auf der Tabelle
  • USE CATALOG im Ausgabekatalog
  • USE SCHEMA im Ausgabeschema

Ausführen des Notebooks

Um freigegebene Ausgabetabellen in Ihrem Ausgabekatalog zu generieren, muss ein Benutzer mit Zugriff auf den Reinraum das Notizbuch ausführen. Siehe "Notizbücher in Reinräumen ausführen". Jedes ausgeführte Notizbuch erstellt ein neues Ausgabeschema und eine neue Tabelle.

Tipp

Sie können Azure Databricks-Aufträge verwenden, um Notizbücher auszuführen und Aufgaben für Ausgabetabellen auszuführen und komplexe Workflows zu ermöglichen. Siehe Verwenden von Azure Databricks-Workflows zum Ausführen von Reinraumnotizbüchern.

Suchen und Anzeigen einer Ausgabetabelle

Der Benutzer, der das Notizbuch ausführt, das die Ausgabetabelle erstellt, kann einen Link zur Ausgabetabelle im Verlauf des Notizbuchs finden und Detailseiten in der Benutzeroberfläche für Clean Rooms ausführen. In beiden Fällen befindet sich der Link im Feld "Ausgabeschema" . Weitere Informationen finden Sie unter Überwachen des Notizbuchs für saubere Räume.

Ausführungsverlauf:

Ausgabeschemalink im Ausführungsverlauf

Ausführen von Details:

Ausgabeschemalink in Ausführungsdetails

Sie finden den Ausgabekatalog auch in der Liste der freigegebenen Kataloge im Katalogkatalogbereich des Katalogkatalogs.

Begrenzungen

Zusätzlich zu den Anforderungen, die in der Übersicht über Ausgabetabellen und vor Beginn aufgeführt sind, haben Ausgabetabellen die folgenden Einschränkungen:

  • Ausgabetabellen werden nur unterstützt, wenn der zentrale Reinraum in AWS gehostet wird und wann der Reinraum erstellt wurde, nachdem die Ausgabetabellenfunktion veröffentlicht wurde.
  • Es werden nur Tabellen unterstützt. Volumes und Ansichten, z. B. nicht.
  • Sie können bis zu 100 Ausgabetabellen pro Notizbuch erstellen.