Che cos'è il processo Apache Airflow?
Nota
Il processo Apache Airflow è alimentato da Apache Airflow.
Il processo Apache Airflow è la nuova generazione di Gestione orchestrazione flussi di lavoro di Azure Data Factory. È un modo semplice ed efficiente per creare e gestire processi di orchestrazione Apache Airflow , consentendo di eseguire grafici aciclici diretti (DAG) su larga scala. È la parte di Data Factory di Fabric che consente di usare un'esperienza di integrazione dei dati moderna per inserire, preparare e trasformare i dati da un set completo di origini dati, ad esempio database, data warehouse, Lakehouse, dati in tempo reale e altro ancora.
Quando usare il processo Apache Airflow?
I processi Apache Airflow offrono un servizio gestito che consente agli utenti di creare e gestire i DAG basati su Python (grafici aciclici diretti) per l'orchestrazione del flusso di lavoro, senza doversi preoccupare dell'infrastruttura sottostante. Se si ha esperienza con Apache Airflow o si preferisce un approccio incentrato sul codice, questa opzione è ideale. Al contrario, se si preferisce una soluzione senza codice per l'orchestrazione dei dati, le pipeline di dati offrono un'alternativa intuitiva che non richiede la gestione o la scrittura di flussi di lavoro basati su Python.
Funzionalità chiave
Il processo Apache Airflow ospitato in Microsoft Fabric offre una gamma di funzionalità avanzate, tra cui:
Funzionalità chiave | Processo Apache Airflow in Fabric | Workflow Orchestration Manager in Azure Data Factory |
---|---|---|
Sincronizzazione Git | Sì | Sì |
Abilitare AKV (Azure Key Vault) come back-end | Sì | Sì |
Installare un pacchetto privato come requisito | Sì | Sì |
Log di diagnostica e metriche | No | Sì |
Archiviazione BLOB | No | Sì |
Indirizzo IP del cluster Apache Airflow | Sì | Sì |
Scalabilità automatica per la gestione dei picchi di esecuzione del carico di lavoro di produzione | Sì | Parziale |
Disponibilità elevata per ridurre interruzioni/tempi di inattività | Sì | No |
Operatori differibili per sospendere gli operatori inattivi e liberare i lavoratori | Sì | No |
Sospendere e riprendere la durata (durata) | Sì | No |
Esperienza SaaSified - 10 sec per iniziare - Creazione di DAG - Versione di valutazione gratuita di Fabric | Sì | No |
Disponibilità dell'area (anteprima pubblica)
- Australia orientale
- Australia sud-orientale
- Brasile meridionale
- Canada orientale
- Canada centrale
- Asia orientale
- Stati Uniti orientali
- Germania centro-occidentale
- Giappone orientale
- Giappone occidentale
- Europa settentrionale
- Sudafrica settentrionale
- Stati Uniti centro-meridionali
- India meridionale
- Asia sud-orientale
- Svezia centrale
- Svizzera occidentale
- Regno Unito meridionale
- Regno Unito occidentale
- Stati Uniti centro-occidentali
- Europa occidentale
- Stati Uniti occidentali
Versioni supportate di Apache Airflow
- 2.6.3
Supportare la versione di Python
- 3.8.17
Nota
La modifica della versione di Apache Airflow in un runtime di integrazione esistente non è supportata. La soluzione consigliata consiste invece nel creare un nuovo Airflow IR con la versione desiderata
Contenuto correlato
- Guida introduttiva: Creare un processo Apache Airflow.