Dataflow Gen2 con supporto di integrazione CI/CD e Git (anteprima)
Dataflow Gen2 supporta ora l'integrazione continua/distribuzione continua (CI/CD) e l'integrazione Git. Questa funzionalità consente di creare, modificare e gestire flussi di dati in un repository Git connesso all'area di lavoro dell'infrastruttura. È anche possibile usare la funzionalità pipeline di distribuzione per automatizzare la distribuzione dei flussi di dati dall'area di lavoro ad altre aree di lavoro. Questo articolo illustra in dettaglio come usare Dataflow Gen2 con integrazione CI/CD e Git in Fabric Data Factory.
Importante
L'integrazione Git e la pipeline di distribuzione (CI/CD) per Dataflows Gen2 in Data Factory per Microsoft Fabric sono attualmente in versione di anteprima pubblica. Queste informazioni si riferiscono a un prodotto in anteprima che può essere modificato in modo sostanziale prima del rilascio. Microsoft non fornisce alcuna garanzia, espressa o implicita, in relazione alle informazioni fornite qui.
Nuove funzionalità
Con Dataflow Gen2 (anteprima CI/CD), è ora possibile:
- Usare il supporto dell'integrazione Git per Dataflow Gen2.
- Usare la funzionalità pipeline di distribuzione per automatizzare la distribuzione dei flussi di dati dall'area di lavoro ad altre aree di lavoro.
- Usare le impostazioni di Infrastruttura e l'utilità di pianificazione per aggiornare e modificare le impostazioni per Dataflow Gen2.
- Creare il flusso di dati Gen2 direttamente in una cartella dell'area di lavoro.
Prerequisiti
Per iniziare, è necessario soddisfare i prerequisiti seguenti:
- Avere un account tenant di Microsoft Fabric con una sottoscrizione attiva. Creare un account gratuitamente.
- Assicurarsi di disporre di un'area di lavoro abilitata per Microsoft Fabric.
- Per sfruttare l'integrazione con Git, assicurarsi che sia abilitata per l'area di lavoro. Per altre informazioni sull'abilitazione dell'integrazione git, vedere Introduzione all'integrazione con Git.
Creare un flusso di dati Gen2 con supporto CI/CD e Git
Per creare un dataflow Gen2 con supporto CI/CD e Git, seguire questa procedura:
Nell'area di lavoro Infrastruttura selezionare Crea nuovo elemento e quindi selezionare Dataflow Gen2.
Assegnare un nome al flusso di dati e abilitare l'integrazione git. Selezionare Crea.
Il flusso di dati viene creato e viene reindirizzato all'area di disegno di creazione del flusso di dati. È ora possibile iniziare a creare il flusso di dati.
Al termine, selezionare Salva ed esegui.
Dopo la pubblicazione, il flusso di dati ha lo stato di cui non è stato eseguito il commit.
Per eseguire il commit del flusso di dati nel repository Git, selezionare l'icona del controllo del codice sorgente nell'angolo in alto a destra della visualizzazione dell'area di lavoro.
Selezionare tutte le modifiche da eseguire per il commit e quindi selezionare Commit.
È ora disponibile un dataflow Gen2 con supporto CI/CD e Git. È consigliabile seguire le procedure consigliate per l'uso dell'integrazione CI/CD e Git in Fabric descritto nell'esercitazione Scenario 2 - Sviluppare usando un'altra area di lavoro .
Aggiornare un flusso di dati Gen2 o pianificare un aggiornamento
È possibile aggiornare un dataflow Gen2 con supporto CI/CD e Git in due modi, manualmente o pianificando un aggiornamento. Le sezioni seguenti descrivono come aggiornare un dataflow Gen2 con il supporto CI/CD e Git.
Aggiorna
Nell'area di lavoro infrastruttura selezionare l'icona con i puntini di sospensione per altre opzioni accanto al flusso di dati che si vuole aggiornare.
Selezionare Aggiorna ora.
Pianificare un aggiornamento
Se il flusso di dati deve essere aggiornato a intervalli regolari, è possibile pianificare l'aggiornamento usando l'utilità di pianificazione di Fabric.
Nell'area di lavoro Infrastruttura selezionare l'icona con i puntini di sospensione per altre opzioni accanto al flusso di dati che si vuole aggiornare.
Selezionare Pianifica.
Nella pagina pianificazione è possibile impostare la frequenza di aggiornamento e l'ora di inizio e l'ora di fine, dopo la quale è possibile applicare le modifiche.
Per avviare l'aggiornamento ora, selezionare il pulsante Aggiorna .
Cronologia e impostazioni degli aggiornamenti
Per visualizzare la cronologia degli aggiornamenti del flusso di dati, è possibile selezionare la scheda Cronologia aggiornamenti nel menu a discesa oppure passare all'hub di monitoraggio e selezionare il flusso di dati di cui si vuole visualizzare la cronologia degli aggiornamenti.
Impostazioni per Dataflow Gen2 con CI/CD
L'accesso alle impostazioni del nuovo Dataflow Gen2 con CI/CD e supporto Git è simile a qualsiasi altro elemento di Fabric. È possibile accedere alle impostazioni selezionando l'icona con i puntini di sospensione altre opzioni accanto al flusso di dati e selezionando le impostazioni.
Limitazioni e problemi noti
Anche se Dataflow Gen2 con CI/CD e supporto Git offre un potente set di funzionalità per la collaborazione adatta alle imprese, ciò ci ha richiesto di ricompilare il back-end all'architettura a fabric. Ciò significa che alcune funzionalità non sono ancora disponibili o presentano limitazioni. Microsoft sta lavorando attivamente per migliorare l'esperienza e aggiornerà questo articolo man mano che vengono aggiunte nuove funzionalità.
- Gli artefatti di staging si trovano in alcune esperienze visibili come l'interfaccia utente ALM. Gli artefatti di staging verranno nascosti in tutte le esperienze future.
- Quando si elimina l'ultima versione di Dataflow Gen2 con supporto CI/CD e Git, gli artefatti di staging diventano visibili nell'area di lavoro e possono essere eliminati dall'utente.
- Alcune esperienze indicano il supporto per le API REST, ma queste API non sono ancora disponibili. Tutti i flussi di dati Gen2 con CI/CD e il supporto Git supporteranno l'API pubblica di Fabric in futuro.
- L'orchestrazione di un aggiornamento di Dataflow Gen2 con CI/CD e supporto Git non è possibile nelle pipeline di dati di Fabric.
- La visualizzazione Area di lavoro non viene visualizzata se è in corso un aggiornamento per il flusso di dati.
- Copilot per Dataflow Gen2 con CI/CD e supporto Git non è ancora disponibile.
- Le connessioni gateway di rete virtuale non sono ancora supportate nell'esperienza di creazione del flusso di dati.
- Non è possibile esportare il Dataflow.json dal menu dell'area di lavoro. Le soluzioni alternative che consentono di esportare il flusso di dati sono:
- Usare l'API pubblica dell'infrastruttura per ottenere il Dataflow.json.
- Usare la funzionalità di esportazione del modello di Power Query per esportare la definizione del flusso di dati.
- Usare OneLake Explorer nell'area di lavoro per ottenere la definizione del flusso di dati.
- Dataflow Gen2 con supporto CI/CD e Git non supporta la funzionalità di acquisizione della proprietà nell'area di lavoro Infrastruttura. Pertanto, solo l'autore del flusso di dati può modificare il flusso di dati. Se si vuole collaborare in un flusso di dati, è possibile usare rami nel repository Git e creare una richiesta pull per unire le modifiche. Per altre informazioni, vedere Scenario 2 - Sviluppare usando un'altra area di lavoro.
- Quando si esegue la diramazione in un'altra area di lavoro, un aggiornamento di Dataflow Gen2 potrebbe non riuscire con il messaggio che indica che non è stato possibile trovare il lakehouse di staging. In questo caso, creare un nuovo dataflow Gen2 con ci/CD e supporto Git nell'area di lavoro per attivare la creazione del lakehouse di staging. In seguito, tutti gli altri flussi di dati nell'area di lavoro devono ricominciare a funzionare.
- Quando si crea un nuovo elemento nell'area di lavoro, potrebbe essere visualizzato l'elemento "Dataflow Gen2 (CI/CD, anteprima)". Ignorare questa e seguire le istruzioni descritte in questo articolo. L'abilitazione del supporto CI/CD e Git potrebbe richiedere del tempo fino a quando l'area non visualizza la casella di controllo.
- La copia rapida potrebbe non essere abilitata per impostazione predefinita nel flusso di dati. È possibile abilitarla usando le impostazioni del flusso di dati.
- Le connessioni che usano un gateway dati locale causano attualmente problemi nell'aggiornamento del flusso di dati. È consigliabile usare un metodo diverso per ottenere dati da origini dati on-premises nel sistema fabric.
Ci impegniamo a migliorare continuamente Dataflow Gen2 con il supporto CI/CD e Git e apprezziamo la pazienza mentre lavoriamo su questi miglioramenti.