Delen via


Uitvoertabellen maken en gebruiken in Databricks Clean Rooms

Belangrijk

Deze functie is beschikbaar als openbare preview.

In dit artikel worden uitvoertabellen geïntroduceerd, die tijdelijke alleen-lezentabellen zijn die worden gegenereerd door een notebookuitvoering en gedeeld met de Unity Catalog-metastore van de notebookrunner. In dit artikel wordt beschreven hoe u een notebook gebruikt om uitvoertabellen te maken en hoe samenwerkers deze uitvoertabellen kunnen lezen in hun Unity Catalog-metastore.

Overzicht van uitvoertabellen

Met uitvoertabellen kunt u de uitvoer van notebooks die in een schone ruimte worden uitgevoerd, tijdelijk opslaan in een uitvoercatalogus in uw Unity Catalog-metastore, waar u de gegevens beschikbaar kunt maken voor leden van uw team die de notebooks zelf niet kunnen uitvoeren. U kunt ook Azure Databricks-taken gebruiken om notebooks uit te voeren en taken uit te voeren op uitvoertabellen. In combinatie met het taaktype Clean Room-notitieblok en ondersteuning voor taakwaarden kunt u met uitvoertabellen complexe werkstromen maken die afhankelijk zijn van notitieblokken voor schone ruimten.

Uitvoertabellen zijn alleen-lezen.

Alleen de specifieke principal (gebruiker, groep of service-principal) die het notebook uitvoert, heeft standaard leestoegang tot de uitvoertabel. Er is geen schrijftoegang. Een metastore-beheerder kan leestoegang verlenen tot andere principals in hun Azure Databricks-account, met behulp van standaardbevoegdheden voor Unity Catalog.

Uitvoertabellen worden 30 dagen opgeslagen in de standaardopslaglocatie van de centrale clean room en gedeeld met de metastore van de samenwerker met behulp van Delta Sharing. Als u een uitvoertabel langer dan 30 dagen wilt bewaren, moet u deze kopiëren naar de lokale opslag.

Elke notebookuitvoering maakt een nieuw schema in de uitvoercatalogus. Nieuwe uitvoeringen kunnen geen bestaande uitvoertabel toevoegen.

Belangrijk

Uitvoertabellen worden alleen ondersteund wanneer de centrale clean room wordt gehost op AWS. Samenwerkers in Databricks in alle drie de clouds, AWS, Azure en Google Cloud, kunnen echter notebooks delen die uitvoertabellen maken en uitvoertabellen lezen die worden gegenereerd wanneer ze gedeelde notebooks uitvoeren. Google Cloud-medewerkers moeten deelnemers zijn in de privé-preview van Clean Rooms.

Een uitvoertabel maken

Als u een uitvoertabel wilt maken, gebruikt u de parameters cr_output_catalog en cr_output_schema in de driedelige tabelnaamruimte. Elke uitvoering van het notebook produceert een nieuw schema.

In het volgende voorbeeld maakt de notebookcel een uitvoertabel die wordt aangeroepen overlapping_users in de uitvoercatalogus van de collborator waarin de gebruikers worden vermeld waarvan het e-mailadres wordt weergegeven in zowel de als de collaborator.advertiser.profilescreator.publisher.profiles tabellen.

CREATE TABLE identifier(:cr_output_catalog || '.' || :cr_output_schema || '.overlapping_users') AS
SELECT collab_profiles.*
FROM collaborator.advertiser.profiles AS collab_profiles
JOIN creator.publisher.profiles AS creator_profiles
ON collab_profiles.email = creator_profiles.email

Een uitvoertabel lezen

Uitvoertabellen worden weergegeven in een gedeelde catalogus in de metastore van de notebook-runner. In het deelvenster Cataloguscatalogus van Catalog Explorer worden ze weergegeven in de lijst met gedeelde catalogussen.

Het lezen van een uitvoertabel is net zoals het lezen van een andere tabel in Unity Catalog. U moet zich in de tabel, SELECT in de gedeelde uitvoercatalogus en USE CATALOG in het automatisch gegenereerde schema bevindenUSE SCHEMA. De gebruiker die het notitieblok heeft uitgevoerd dat de tabel heeft gemaakt, heeft standaard deze machtigingen.

Voordat u begint

In deze sectie worden cloud-, configuratie- en rekenvereisten beschreven voor het lezen van uitvoertabellen.

Cloudvereisten

Hoewel de centrale clean room zich op AWS moet bevinden om uitvoertabellen te ondersteunen, kunnen werkruimten van medewerkers zich in een van de drie clouds bevinden: AWS, Azure of Google Cloud. Google Cloud-medewerkers moeten deelnemers zijn in de privé-preview van Clean Rooms.

Vereiste voor gedeelde uitvoercatalogus

Voordat u uitvoertabellen kunt lezen, moet een gebruiker de catalogus met deze tabellen maken. U hoeft dit slechts één keer per schone kamer te doen.

Vereiste machtigingen: EXECUTE_CLEAN_ROOM_TASK

  1. Klik in uw Azure Databricks-werkruimte op CataloguspictogramCatalogus.
  2. Klik op de pagina Snelle toegang op de knop Schone ruimten > .
  3. Selecteer de schone kamer in de lijst.
  4. Klik in het rechterdeelvenster onder Uitvoer op Catalogus maken.
  5. Voer de naam van de uitvoercatalogus in of accepteer de standaardwaarde.<clean-room-name>_output

De uitvoercatalogus wordt weergegeven in de lijst met gedeelde catalogi in het deelvenster Catalogusverkenner. Elke schone ruimte waaraan u deelneemt, kan één gedeelde uitvoercatalogus hebben in uw metastore.

Rekenvereisten

Voor query's in uitvoertabellen is serverloze berekening vereist. Zie Verbinding maken met serverloze berekeningen.

Vereiste machtigingen voor het lezen van een uitvoertabel

De gebruiker die het notebook heeft uitgevoerd dat de uitvoertabel heeft gemaakt, is standaard gemachtigd om te lezen uit de uitvoertabel. Alle andere gebruikers moeten beschikken over de volgende machtigingen:

  • SELECT op de tabel
  • USE CATALOG in de uitvoercatalogus
  • USE SCHEMA in het uitvoerschema

Het notitieblok uitvoeren

Als u gedeelde uitvoertabellen in uw uitvoercatalogus wilt genereren, moet een gebruiker met toegang tot de clean room het notebook uitvoeren. Zie Notebooks uitvoeren in schone ruimten. Elke notebookuitvoering maakt een nieuw uitvoerschema en een nieuwe uitvoertabel.

Tip

U kunt Azure Databricks-taken gebruiken om notebooks uit te voeren en taken uit te voeren op uitvoertabellen, waardoor complexe werkstromen mogelijk zijn. Zie Azure Databricks-werkstromen gebruiken om clean room notebooks uit te voeren.

Een uitvoertabel zoeken en weergeven

De gebruiker die het notebook uitvoert waarmee de uitvoertabel wordt gemaakt, kan een koppeling naar de uitvoertabel vinden in de uitvoeringsgeschiedenis van het notebook en detailpagina's uitvoeren in de gebruikersinterface van Clean Rooms . In beide gevallen bevindt de koppeling zich in het veld Uitvoerschema . Zie Monitor clean room notebook runs.

Uitvoeringsgeschiedenis:

Koppeling uitvoerschema in uitvoeringsgeschiedenis

Details van uitvoering:

Koppeling uitvoerschema in uitvoeringsdetails

U kunt de uitvoercatalogus ook vinden in de lijst met gedeelde catalogi in het deelvenster Cataloguscatalogus van Catalog Explorer.

Beperkingen

Naast de vereisten die worden vermeld in Overzicht van uitvoertabellen en Voordat u begint, hebben uitvoertabellen de volgende beperkingen:

  • Uitvoertabellen worden alleen ondersteund wanneer de centrale schone ruimte wordt gehost op AWS en wanneer de schone ruimte is gemaakt nadat de uitvoertabelfunctie is vrijgegeven.
  • Alleen tabellen worden ondersteund. Volumes en weergaven zijn bijvoorbeeld niet.
  • U kunt maximaal 100 uitvoertabellen per notebook maken.