Sdílet prostřednictvím


Co jsou schémata lakehouse (Preview)?

Lakehouse podporuje vytváření vlastních schémat. Schémata umožňují seskupit tabulky pro lepší zjišťování dat, řízení přístupu a další.

Vytvoření schématu lakehouse

Pokud chcete povolit podporu schématu pro váš lakehouse, zaškrtněte při jeho vytvoření políčko vedle schémat Lakehouse (Public Preview).

Snímek obrazovky s dialogovým oknem New Lakehouse

Důležité

Názvy pracovních prostorů musí obsahovat jenom alfanumerické znaky kvůli omezením verze Preview. Pokud se v názvech pracovních prostorů použijí speciální znaky, některé z funkcí Lakehouse nebudou fungovat.

Jakmile vytvoříte lakehouse, můžete v části Tabulky najít výchozí schéma s názvem dbo. Toto schéma je vždy tam a nejde ho změnit ani odebrat. Pokud chcete vytvořit nové schéma, najeďte myší na Tabulky, vyberte ...a zvolte Nové schéma. Zadejte název schématu a vyberte Vytvořit. Schéma se zobrazí v části Tabulky v abecedním pořadí.

Snímek obrazovky s dialogovým oknem nového schématu lakehouse

Ukládání tabulek ve schématech lakehouse

K uložení tabulky do schématu potřebujete název schématu. V opačném případě přejde do výchozího schématu dbo .

df.write.mode("Overwrite").saveAsTable("contoso.sales")

Pomocí Průzkumníka Lakehouse můžete uspořádat tabulky a přetáhnout názvy tabulek do různých schémat.

Animace přesouvání tabulek mezi schématy

Upozornění

Pokud upravíte tabulku, musíte také aktualizovat související položky, jako je kód poznámkového bloku nebo toky dat, aby byly v souladu se správným schématem.

Přenesení více tabulek pomocí zástupce schématu

Pokud chcete odkazovat na více tabulek Delta z jiného úložiště Fabric Lakehouse nebo externího úložiště, použijte zástupce schématu, který zobrazí všechny tabulky ve zvoleném schématu nebo složce. Všechny změny tabulek ve zdrojovém umístění se také zobrazí ve schématu. Pokud chcete vytvořit zástupce schématu, najeďte myší na Tabulky, vyberte možnost ...a zvolte Zástupce nového schématu. Pak vyberte schéma na jiném jezeře nebo ve složce s tabulkami Delta ve vašem externím úložišti, jako je Azure Data Lake Storage (ADLS) Gen2. Tím se vytvoří nové schéma s odkazovanými tabulkami.

Snímek obrazovky znázorňující zástupce nového schématu lakehouse

Přístup k schématům Lakehouse pro vytváření sestav Power BI

Pokud chcete vytvořit sémantický model, stačí vybrat tabulky, které chcete použít. Tabulky můžou být v různých schématech. Pokud tabulky z různých schémat sdílejí stejný název, zobrazí se v zobrazení modelu čísla vedle názvů tabulek.

Schémata Lakehouse v poznámkovém bloku

Když se podíváte na schéma povolené jezerohouse v Průzkumníku objektů poznámkového bloku, uvidíte, že tabulky jsou ve schématech. Tabulku můžete přetáhnout do buňky kódu a získat fragment kódu, který odkazuje na schéma, ve kterém se tabulka nachází. Pomocí tohoto oboru názvů můžete odkazovat na tabulky v kódu: workspace.lakehouse.schema.table. Pokud některý z prvků vynecháte, exekutor použije výchozí nastavení. Pokud například zadáte pouze název tabulky, použije se výchozí schéma (dbo) z výchozího objektu lakehouse pro poznámkový blok.

Důležité

Pokud chcete ve svém kódu použít schémata, ujistěte se, že je povolené schéma výchozího objektu Lakehouse pro poznámkový blok.

Dotazy Spark SQL mezi pracovními prostory

Pomocí oboru názvů workspace.lakehouse.schema.table můžete odkazovat na tabulky v kódu. Tímto způsobem můžete spojit tabulky z různých pracovních prostorů, pokud má uživatel, který spouští kód, oprávnění pro přístup k tabulkám.

SELECT * 
    FROM operations.hr.hrm.employees as employees 
    INNER JOIN global.corporate.company.departments as departments
    ON employees.deptno = departments.deptno;

Důležité

Ujistěte se, že spojíte tabulky pouze z jezer s povolenými schématy. Spojení tabulek z lakehouse, které nemají povolená schémata, nebude fungovat.

Omezení verze Public Preview

Níže uvedené nepodporované funkce jsou pro aktuální verzi Public Preview. Budou vyřešeny v nadcházejících verzích před obecnou dostupností.

Nepodporované funkce nebo funkce Notes
Sdílené jezero Použití pracovního prostoru v oboru názvů pro sdílené objekty lakehouse nebude fungovat, například wokrkspace.sharedlakehouse.schema.table. Uživatel THe musí mít roli pracovního prostoru, aby mohl používat pracovní prostor v namaspace.
Jiné schéma tabulky než Delta, spravované tabulky Získání schématu pro spravované tabulky bez formátu Delta (například CSV) není podporované. Rozšíření těchto tabulek v Průzkumníku lakehouse nezobrazuje žádné informace o schématu v uživatelském prostředí.
Externí tabulky Sparku Externí operace tabulek Sparku (například zjišťování, získání schématu atd.) se nepodporují. Tyto tabulky nejsou v uživatelském prostředí identifikované.
Veřejné rozhraní API Veřejná rozhraní API (tabulky seznamu, načtení tabulky, zveřejnění rozšířené vlastnosti defaultSchema atd.) nejsou podporována pro lakehouse s povoleným schématem. Výsledkem existujících veřejných rozhraní API volaných ve schématu Lakehouse je chyba.
Údržba tabulek Nepodporováno
Aktualizace vlastností tabulky Nepodporováno
Název pracovního prostoru obsahující speciální znaky Pracovní prostor se speciálními znaky (například mezera, lomítka) se nepodporuje. Zobrazí se chyba uživatele.
Zobrazení Sparku Nepodporováno
Specifické funkce Hivu Nepodporováno
Spark.catalog API Nepodporováno Místo toho použijte Spark SQL.
USE <schemaName> Nefunguje mezi pracovními prostory, ale podporuje se v rámci stejného pracovního prostoru.
Migrace Migrace existujících objektů Lakehouse bez schématu na objekty Lakehouses založená na schématu se nepodporuje.