Kanály nasazení Lakehouse a integrace Gitu (Preview)
Lakehouse se integruje s možnostmi správy životního cyklu v Microsoft Fabric a poskytuje standardizovanou spolupráci mezi všemi členy vývojového týmu v průběhu celého života produktu. Správa životního cyklu usnadňuje efektivní proces správy verzí produktů a vydávání verzí tím, že nepřetržitě poskytuje funkce a opravy chyb do více prostředí. Další informace najdete v tématu Co je správa životního cyklu v Microsoft Fabric?.
Důležité
Tato funkce je ve verzi Preview.
Integrace Gitu Lakehouse
Lakehouse je položka, která obsahuje metadata i data odkazovaná v několika objektech v pracovním prostoru. Lakehouse obsahuje tabulky, složky a zástupce jako primární spravovatelné položky kontejneru dat. Z hlediska vývojového pracovního postupu můžou na Lakehouse odkazovat následující závislé objekty:
- Toky dat a datové kanály
- Definice úloh Sparku
- Poznámkové bloky
- Sémantické modely a Power BI
Výchozí sémantická metadata koncového bodu a koncového bodu SQL Analytics souvisejí s Lakehousem a ve výchozím nastavení se spravují procesem aktualizace Gitu. Protože se v Gitu nesledují základní data, sledují se pouze metadata.
Reprezentace Gitu
Následující informace o lakehouse se serializují a sledují v připojeném pracovním prostoru Gitu:
- Display name
- Popis
- Logický identifikátor GUID
Poznámka:
Sledovaný logický identifikátor GUID je automaticky vygenerovaný identifikátor křížového pracovního prostoru představující položku a jeho reprezentaci správy zdrojového kódu.
Důležité
V aktuálním prostředí se v Gitu sleduje jenom artefakt kontejneru Lakehouse. Tabulky (Delta a non-Delta) a složky v sekci soubory nejsou sledovány a verzovány v gitu.
Funkce integrace Gitu Lakehouse
K dispozici jsou následující možnosti:
- Serializace metadat objektu Lakehouse na reprezentaci GIT JSON.
- Použijte změny přímo nebo použijte žádost o přijetí změn k řízení změn v nadřazených nebo podřízených pracovních prostorech a větvích.
- Přejmenování jezeren se sleduje v Gitu. Při aktualizaci přejmenovaného lakehouse se také přejmenuje výchozí sémantický datový model a koncový bod SQL Analytics.
- U tabulek a složekmetadat není použita žádná akce a data těchto položek se vždy zachovají.
- metadata OneLake Shortcuts se v Gitu zachovají.
Funkce integrace Gitu pro OneLake Shortcuts
- Definice zástupců v sekci Tabulky i Soubory se ukládají do souboru s názvem
shortcuts.metadata.json
ve složce Lakehouse v Gitu. - Podporují se a automaticky sledují následující operace: přidání, odstranění a aktualizace klávesových zkratek.
- Operace je možné provádět přímo v uživatelském rozhraní Fabric nebo v úložišti Git změnou souboru
shortcuts.metadata.json
. - Během synchronizace Gitu se automaticky aktualizují klávesové zkratky s interními cíli (OneLake Shortcuts). Aby byl zástupce platný, musí být tyto odkazy v rámci pracovního prostoru platnými cíli. Pokud jsou cíle pro zástupce definované v oddílu tabulek lakehouse neplatné, přesunou se tyto klávesové zkratky do oddílu
Unidentified
, dokud se nepřeloží odkazy.
Důležité
Buďte opatrní při změně vlastností OneLake Shortcut přímo v souboru shortcuts.metadata.json
. Nesprávné změny vlastností, zejména identifikátorů GUID, mohou při uplatnění aktualizací zpět do pracovního prostoru učinit zástupce OneLake neplatným.
Důležité
Aktualizace z Git nahradí stav zástupců v pracovním prostoru. Všechny klávesové zkratky v pracovním prostoru se vytvářejí, aktualizují nebo odstraní na základě příchozího stavu z Gitu.
Lakehouse v kanálech nasazení
Lakehouse se podporuje v kanálech nasazení správy životního cyklu Microsoft Fabric. Umožňuje osvědčené postupy segmentace prostředí.
Možnosti integrace kanálů nasazení Lakehouse:
Nasazení napříč vývojovými, testovacími a produkčními pracovními prostory
Lakehouse je možné odebrat jako závislý objekt při nasazení. Podporuje se také mapování různých objektů Lakehouse v kontextu kanálu nasazení.
Pokud není během konfigurace kanálu nasazení zadáno nic, vytvoří se v cílovém pracovním prostoru nový prázdný objekt Lakehouse se stejným názvem. Definice úloh Poznámkového bloku a Sparku se znovu namapují tak, aby odkazovaly na nový objekt Lakehouse v novém pracovním prostoru.
Pokud je závislost Lakehouse nakonfigurovaná tak, aby odkazovala na jinou službu Lakehouse během doby konfigurace kanálu nasazení, například upstream Lakehouse, v cílovém pracovním prostoru se stále vytvoří nový prázdný objekt Lakehouse se stejným názvem, ale odkazy na poznámkové bloky a definice úloh Sparku se zachovají v jiném objektu Lakehouse, jak je požadováno.
Koncové body a sémantické modely SQL Analytics se zřizují jako součást nasazení Lakehouse.
Uvnitř lakehouse se nepřepíše žádný objekt.
Aktualizace názvu Lakehouse je možné synchronizovat mezi pracovními prostory v kontextu kanálu nasazení.
Zkratky OneLake v nasazovacích kanálech
- Definice klávesových zkratek se synchronizují napříč fázemi v nasazovacích pipeline.
- Klávesové zkratky s externími cíli (ADLS Gen2, S3 atd.) jsou ve všech fázích po nasazení stejné.
- Klávesové zkratky s interními cíli (Zkratky OneLake) ve stejném pracovním prostoru se automaticky přemapují napříč fázemi. Klávesové zkratky, které cílí na datový sklad a sémantické modely, se během nasazování znovu nenamapují. Tabulky, složky a soubory se v cílovém pracovním prostoru nevytvořily. Aby zkratka byla platná, musí se tyto odkazy po nasazení vytvořit v cílovém pracovním prostoru.
- Ve scénáři, kdy stejná klávesová zkratka potřebuje cílit na různá umístění v různých fázích. Například ve vývoji přejděte na konkrétní složku v Amazon S3 a v produkčním prostředí na jinou složku v ADLS Gen2. Po nasazení aktualizujte definici OneLake Shortcut v Lakehouse nebo přímo pomocí rozhraní ONELake API.
Důležité
Nasazení přepíše stav zástupců v cílovém pracovním prostoru. Všechny klávesové zkratky v cílovém jezeře se aktualizují nebo odstraní na základě stavu ve zdrojovém jezeře. V cílovém jezeře se vytvoří nové klávesové zkratky. Vždy klikněte na "Zkontrolovat změny", abyste porozuměli změnám, které se nasadí mezi zdrojovými a cílovými pracovními prostory.