Informazioni sulle pipeline
Le pipeline in Microsoft Fabric incapsulano una sequenza di attività che svolgono azioni di spostamento ed elaborazione dei dati. È possibile usare una pipeline per definire le attività di trasferimento e trasformazione dei dati e orchestrarle tramite attività del flusso di controllo che gestiscono la creazione di rami, i cicli e altra logica di elaborazione tipica. Il canvas della pipeline grafica nell'interfaccia utente di Fabric consente di creare pipeline complesse con una codifica minima o senza nessuna esigenza di scrivere codice.
Concetti principali sulle pipeline
Prima di creare pipeline in Microsoft Fabric, è necessario comprendere alcuni concetti di base.
Attività
Le attività sono le azioni da eseguire in una pipeline. È possibile definire un flusso di attività collegandole in una sequenza. Il risultato di una particolare attività (esito positivo, negativo o completamento) può essere usato per dirigere il flusso all'attività successiva nella sequenza.
Esistono due ampie categorie di attività in una pipeline.
Attività di trasformazione dei dati: attività che incapsulano le operazioni di trasferimento dei dati, incluse semplici attività Copia dati che estraggono dati da un'origine e li caricano in una destinazione e attività più complesse Flusso di dati che incapsulano i flussi di dati (Gen2) che applicano trasformazioni ai dati durante il trasferimento. Altre attività di trasformazione dei dati includono le attività Notebook per eseguire un notebook Spark, le attività Stored procedure per eseguire codice SQL, le attività Elimina dati per eliminare i dati esistenti e altre ancora. In OneLake è possibile configurare la destinazione per una lakehouse, un warehouse, database SQL o altre opzioni.
Attività del flusso di controllo: attività che è possibile usare per implementare cicli, diramazione condizionale oppure gestire i valori di variabili e parametri. L'ampia gamma di attività del flusso di controllo consente di implementare una logica di pipeline complessa per orchestrare il flusso di inserimento e trasformazione dei dati.
Suggerimento
Per informazioni dettagliate sulla serie completa di attività della pipeline disponibili in Microsoft Fabric, vedere Panoramica delle attività nella documentazione di Microsoft Fabric.
Parametri
Le pipeline possono essere parametrizzate, consentendo di fornire valori specifici da usare ogni volta che viene eseguita una pipeline. Ad esempio, è possibile usare una pipeline per salvare i dati inseriti in una cartella, ma avere la flessibilità di specificare un nome di cartella ogni volta che viene eseguita la pipeline.
L'uso dei parametri aumenta la riutilizzabilità delle pipeline, consentendo di creare processi flessibili di inserimento e trasformazione dei dati.
Esecuzioni della pipeline
Ogni volta che si esegue una pipeline, viene avviata un'esecuzione della pipeline di dati. Le esecuzioni possono essere avviate su richiesta nell'interfaccia utente di Fabric o pianificate per iniziare a una frequenza specifica. Usare l'ID esecuzione univoco per esaminare i dettagli dell'esecuzione in modo da verificare che siano state completate correttamente e analizzare le impostazioni specifiche usate per ogni esecuzione.