Lakehouse-distributionspipelines och git-integrering (förhandsversion)
Lakehouse integreras med livscykelhanteringsfunktionerna i Microsoft Fabric, vilket ger ett standardiserat samarbete mellan alla medlemmar i utvecklingsteamet under hela produktens livslängd. Livscykelhantering underlättar en effektiv produktversions- och lanseringsprocess genom att kontinuerligt leverera funktioner och felkorrigeringar till flera miljöer. Mer information finns i Vad är livscykelhantering i Microsoft Fabric?.
Viktigt!
Den här funktionen är i förhandsversion.
Git-integrering i Lakehouse
Lakehouse är ett objekt som innehåller både metadata och data som refereras till i flera objekt på arbetsytan. Lakehouse innehåller tabeller, mappar och genvägar som primära hanterbara datacontainerobjekt. Ur ett utvecklingsarbetsflödesperspektiv kan följande beroende objekt referera till ett Lakehouse:
- Dataflöden och datapipelines
- Definitioner för Spark-jobb
- Notebook-filer
- Semantiska modeller och Power BI
Standard-semantisk modell och SQL-analysslutpunktsmetadata är relaterade till en Lakehouse och hanteras av git-uppdateringsprocessen som standard. Eftersom principdata inte spåras i git spåras endast metadata.
Git-representation
Följande lakehouse-information serialiseras och spåras på en git-ansluten arbetsyta:
- Display name
- beskrivning
- Logiskt guid
Kommentar
Det spårade logiska guid-objektet är en automatiskt genererad identifierare för flera arbetsytor som representerar ett objekt och dess källkontrollrepresentation.
Viktigt!
Endast Lakehouse-containerartefakten spåras i git i den aktuella upplevelsen. Tabeller, mappar, genvägar och andra metadataändringar spåras inte och versionshanteras inte i git.
Lakehouse git-integreringsfunktioner
Följande funktioner är tillgängliga:
- Serialisering av Lakehouse-objektmetadata till en git JSON-representation.
- Tillämpa ändringar direkt eller använd pull-begäran för att styra ändringar på uppströms- eller nedströmsarbetsytor och grenar.
- Byt namn på lakehouses spåras i git. Om du uppdaterar ett omdöpt lakehouse byter du även namn på standard-semantisk datamodell och SQL Analytics-slutpunkt.
- Ingen åtgärd tillämpas på tabeller, mappar och genvägar, metadata och data för dessa objekt bevaras alltid.
Lakehouse i distributionspipelines
Lakehouse stöds i distributionspipelines för livscykelhantering i Microsoft Fabric. Det möjliggör metodtips för miljösegmentering.
Integreringsfunktioner för Lakehouse-distributionspipelines:
Distribution över arbetsytor för utveckling, testning och produktion.
Lakehouse kan tas bort som ett beroende objekt vid distributionen. Det finns också stöd för att mappa olika Lakehouses i distributionspipelinekontexten.
Om inget anges under konfigurationen av distributionspipelinen skapas ett nytt tomt Lakehouse-objekt med samma namn på målarbetsytan. Notebook- och Spark-jobbdefinitioner mappas om för att referera till det nya Lakehouse-objektet på den nya arbetsytan.
Om Lakehouse-beroendet har konfigurerats för att referera till en annan Lakehouse under konfigurationstiden för distributionspipelinen, till exempel det överordnade Lakehouse, skapas fortfarande ett nytt tomt Lakehouse-objekt med samma namn på målarbetsytan, men referenser för Notebooks och Spark-jobbdefinitioner bevaras till ett annat Lakehouse på begäran.
SQL Analytics-slutpunkter och semantiska modeller etableras som en del av Lakehouse-distributionen.
Inget objekt i Lakehouse skrivs över.
Uppdateringar av Lakehouse-namnet kan synkroniseras mellan arbetsytor i en distributionspipelinekontext.