Vytváření a práce s výstupními tabulkami v čistých místnostech Databricks
Tento článek představuje výstupní tabulky, které jsou dočasné tabulky jen pro čtení vygenerované spuštěním poznámkového bloku a sdíleny s metastorem katalogu Unity spouštěče poznámkových bloků. Tento článek popisuje, jak pomocí poznámkového bloku vytvořit výstupní tabulky a jak můžou spolupracovníci tyto výstupní tabulky číst v metastore katalogu Unity.
Přehled výstupních tabulek
Výstupní tabulky umožňují dočasně uložit výstup poznámkových bloků, které se spouští v čisté místnosti, do výstupního katalogu v metastore katalogu Unity, kde můžete zpřístupnit data členům vašeho týmu, kteří nemají možnost spouštět samotné poznámkové bloky. Úlohy Azure Databricks můžete použít také ke spouštění poznámkových bloků a provádění úloh ve výstupních tabulkách. V kombinaci s typem úlohy Poznámkový blok Vyčistit místnost a podporou hodnot úkolů umožňují výstupní tabulky vytvářet složité pracovní postupy, které závisí na poznámkových blocích v čisté místnosti.
Výstupní tabulky jsou jen pro čtení.
Pouze konkrétní objekt zabezpečení (uživatel, skupina nebo instanční objekt), který spouští poznámkový blok, má výchozí přístup pro čtení k výstupní tabulce. Neexistuje žádný přístup k zápisu. Správce metastoru může udělit přístup pro čtení jiným objektům zabezpečení ve svém účtu Azure Databricks pomocí standardních oprávnění katalogu Unity.
Výstupní tabulky se ukládají po dobu 30 dnů ve výchozím umístění úložiště centrální čisté místnosti a sdílí se s metastorem spolupracovníka pomocí rozdílového sdílení. Pokud chcete zachovat výstupní tabulku po dobu delší než 30 dnů, musíte ji zkopírovat do místního úložiště.
Každé spuštění poznámkového bloku vytvoří nové schéma ve výstupním katalogu. Nová spuštění nemůžou připojit existující výstupní tabulku.
Důležité
Výstupní tabulky se podporují jenom v případech, kdy je centrální čistá místnost hostovaná v AWS nebo Azure. Spolupracovníci v Databricks na všech třech cloudech – AWS, Azure a Google Cloud – ale můžou sdílet poznámkové bloky, které vytvářejí výstupní tabulky a můžou číst výstupní tabulky, které se generují při spouštění sdílených poznámkových bloků. Spolupracovníci Google Cloudu musí být účastníky v privátní verzi Preview Clean Rooms.
Vytvoření výstupní tabulky
K vytvoření výstupní tabulky použijte parametry cr_output_catalog
a cr_output_schema
v oboru názvů třídílné tabulky. Každé spuštění poznámkového bloku vytvoří nové schéma.
V následujícím příkladu vytvoří buňka poznámkového bloku výstupní tabulku volanou overlapping_users
ve výstupním katalogu collboratoru, která uvádí uživatele, jejichž e-mailová adresa se zobrazuje v tabulkách collaborator.advertiser.profiles
i creator.publisher.profiles
v tabulkách.
CREATE TABLE identifier(:cr_output_catalog || '.' || :cr_output_schema || '.overlapping_users') AS
SELECT collab_profiles.*
FROM collaborator.advertiser.profiles AS collab_profiles
JOIN creator.publisher.profiles AS creator_profiles
ON collab_profiles.email = creator_profiles.email
Čtení výstupní tabulky
Výstupní tabulky se zobrazí ve sdíleném katalogu v metastoru spouštěče poznámkových bloků. V podokně Katalog Průzkumníka katalogů se zobrazí v seznamu Sdílené katalogy.
Čtení výstupní tabulky je podobné čtení jakékoli jiné tabulky v katalogu Unity. Musíte mít SELECT
v tabulce, USE CATALOG
ve sdíleném výstupním katalogu a USE SCHEMA
v automaticky generovaném schématu. Uživatel, který spustil poznámkový blok, který vytvořil tabulku, má ve výchozím nastavení tato oprávnění.
Než začnete
Tato část popisuje požadavky na cloud, konfiguraci a výpočetní prostředky pro čtení výstupních tabulek.
Požadavky na cloud
Centrální čistá místnost musí být v AWS, aby podporovala výstupní tabulky, pracovní prostory spolupracovníků můžou být v libovolném ze tří cloudů: AWS, Azure nebo Google Cloud. Spolupracovníci Google Cloudu musí být účastníky v privátní verzi Preview Clean Rooms.
Požadavek na sdílený výstupní katalog
Před čtením výstupních tabulek musí uživatel vytvořit katalog, který je obsahuje. Stačí to udělat jen jednou na čistou místnost. Vlastník čisté místnosti má ve výchozím nastavení oprávnění ke čtení a správě výstupního katalogu.
Požadovaná oprávnění: EXECUTE_CLEAN_ROOM_TASK
- V pracovním prostoru Azure Databricks klikněte na
Katalog.
- Na stránce Rychlý přístup klikněte na tlačítko Vyčistit místnosti>.
- V seznamu vyberte čistou místnost.
- V pravém podokně v části Výstup klikněte na Vytvořit katalog.
- Zadejte název výstupního
Výstupní katalog se zobrazí v seznamu sdílených katalogů v podokně Katalog Průzkumníka katalogů . Každý čistý pokoj, do kterého se účastníte, může mít v metastoru jeden sdílený výstupní katalog.
Požadavky na výpočetní prostředky
Dotazy na výstupní tabulky vyžadují bezserverové výpočetní prostředky. Viz Připojení k výpočetním prostředkům bez serveru.
Oprávnění potřebná ke čtení výstupní tabulky
Uživatel, který spustil poznámkový blok, který vytvořil výstupní tabulku a vlastník čisté místnosti, má ve výchozím nastavení oprávnění ke čtení a správě výstupní tabulky. Všem ostatním uživatelům musí být udělena následující oprávnění:
-
SELECT
v tabulce -
USE CATALOG
ve výstupním katalogu -
USE SCHEMA
ve výstupním schématu
Spuštění poznámkového bloku
Pokud chcete vygenerovat sdílené výstupní tabulky ve výstupním katalogu, musí uživatel s přístupem k čisté místnosti spustit poznámkový blok. Viz Spuštění poznámkových bloků v čistých místnostech. Každé spuštění poznámkového bloku vytvoří nové výstupní schéma a tabulku.
Tip
Pomocí úloh Azure Databricks můžete spouštět poznámkové bloky a provádět úlohy s výstupními tabulkami, což umožňuje složité pracovní postupy. Viz Použití pracovních postupů Azure Databricks ke spouštění poznámkových bloků čistých místností.
Vyhledání a zobrazení výstupní tabulky
Uživatel, který spouští poznámkový blok, který vytvoří výstupní tabulku, může najít odkaz na výstupní tabulku v historii spuštění poznámkového bloku a spustit stránky podrobností v uživatelském rozhraní Čisté místnosti . V oboupřípadechch Viz Monitorování spuštění poznámkového bloku čisté místnosti.
Historie spuštění:
Podrobnosti o spuštění:
Výstupní katalog najdete také v seznamu sdílených katalogů v podokně Katalog Průzkumníka katalogů .
Omezení
Kromě požadavků uvedených v části Přehled výstupních tabulek a Než začnete, mají výstupní tabulky následující omezení:
- Výstupní tabulky se podporují jenom v případech, kdy je centrální čistá místnost hostovaná v AWS nebo Azure a kdy byla vytvořena čistá místnost po vydání funkce výstupní tabulky.
- Podporují se jenom tabulky. Například svazky a zobrazení nejsou.
- Pro každý poznámkový blok můžete vytvořit až 100 výstupních tabulek.