Pipeline di distribuzione lakehouse e integrazione di Git (anteprima)
Lakehouse si integra con le funzionalità di gestione del ciclo di vita in Microsoft Fabric, offrendo una collaborazione standardizzata tra tutti i membri del team di sviluppo durante tutta la vita del prodotto. La gestione del ciclo di vita facilita un processo efficace di controllo delle versioni e rilascio dei prodotti offrendo continuamente funzionalità e correzioni di bug in più ambienti. Per altre informazioni, vedere Che cos'è la gestione del ciclo di vita in Microsoft Fabric?.
Importante
Questa funzionalità è in anteprima.
Integrazione di Git di Lakehouse
Lakehouse è un elemento che contiene sia i metadati che i dati a cui si fa riferimento in più oggetti nell'area di lavoro. Lakehouse contiene tabelle, cartelle e collegamenti come elementi principali del contenitore di dati gestibili. Dal punto di vista del flusso di lavoro di sviluppo, gli oggetti dipendenti seguenti potrebbero fare riferimento a un lakehouse:
- Flussi di dati e pipeline di dati
- Definizioni processo Spark
- Notebook
- Modelli semantici e Power BI
Il modello semantico predefinito e i metadati dell'endpoint di Analisi SQL sono correlati a un lakehouse e gestiti dal processo di aggiornamento Git per impostazione predefinita. Poiché i dati di principio non vengono rilevati in Git, vengono rilevati solo i metadati.
Rappresentazione di Git
Le informazioni sui lakehouse seguenti vengono serializzate e rilevate in un'area di lavoro connessa a Git:
- Nome visualizzato
- Descrizione
- GUID logico
Nota
Il GUID logico rilevato è un identificatore tra aree di lavoro generato automaticamente che rappresenta un elemento e la relativa rappresentazione del controllo del codice sorgente.
Importante
Solo l'artefatto contenitore Lakehouse viene rilevato in Git nell'esperienza corrente. Le modifiche a tabelle, cartelle, collegamenti e altri metadati non vengono rilevate e sono sottoposte a controllo delle versioni in Git.
Funzionalità di integrazione di Git di Lakehouse
Sono disponibili le seguenti funzionalità:
- Serializzazione dei metadati dell'oggetto lakehouse in una rappresentazione JSON Git.
- Applicare le modifiche direttamente o usare una richiesta pull per controllare le modifiche ad aree di lavoro e rami upstream o downstream.
- La ridenominazione dei lakehouse viene rilevata in Git. L'aggiornamento di un lakehouse rinominato rinomina anche il modello di dati semantico predefinito e l'endpoint di Analisi SQL.
- Nessuna azione viene applicata a tabelle, cartelle e collegamenti, i metadati e i dati di tali elementi vengono sempre mantenuti.
Lakehouse nelle pipeline di distribuzione
Lakehouse è supportato nelle pipeline di distribuzione della gestione del ciclo di vita di Microsoft Fabric. Abilita le procedure consigliate per la segmentazione dell'ambiente.
Funzionalità di integrazione delle pipeline di distribuzione lakehouse:
Distribuzione tra aree di lavoro di sviluppo, test e produzione.
Lakehouse può essere rimosso come oggetto dipendente durante la distribuzione. È supportato anche il mapping di diversi lakehouse all'interno del contesto della pipeline di distribuzione.
Se non viene specificato nulla durante la configurazione della pipeline di distribuzione, nell'area di lavoro di destinazione viene creato un nuovo oggetto lakehouse vuoto con lo stesso nome. Le definizioni processo di Spark e notebook vengono mappate per fare riferimento al nuovo oggetto lakehouse nella nuova area di lavoro.
Se la dipendenza lakehouse è configurata per fare riferimento a un altro Lakehouse durante il tempo di configurazione della pipeline di distribuzione, ad esempio lakehouse upstream, un nuovo oggetto lakehouse vuoto con lo stesso nome viene ancora creato nell'area di lavoro di destinazione, ma i riferimenti a definizioniprocesso di Spark e notebook vengono mantenuti in un altro lakehouse come richiesto.
Viene eseguito il provisioning dei modelli semantici e degli endpoint di Analisi SQL come parte della distribuzione di Lakehouse.
Nessun oggetto all'interno del lakehouse viene sovrascritto.
Gli aggiornamenti del nome lakehouse possono essere sincronizzati tra aree di lavoro in un contesto della pipeline di distribuzione.