Condividi tramite


Guida introduttiva: Creare un processo Apache Airflow

Nota

Il processo Apache Airflow è alimentato da Apache Airflow.
Apache Airflow è una piattaforma open source usata per creare, pianificare e monitorare processi complessi a livello di codice. Consente di definire un set di attività, denominate operatori, che possono essere combinate in grafi diretti aciclici (DAG) per rappresentare le pipeline di dati.

Apache Airflow Job offre un modo semplice ed efficiente per creare e gestire ambienti Apache Airflow, consentendo di eseguire facilmente i processi di orchestrazione su larga scala. In questa guida introduttiva si creerà un semplice processo Apache Airflow per acquisire familiarità con l'ambiente e le funzionalità di Apache Airflow Job.

Prerequisiti

  • Abilitare il processo Apache Airflow nel tenant.

Nota

Poiché il processo Apache Airflow è in stato di anteprima, è necessario abilitarlo tramite l'amministratore del tenant. Se il processo Apache Airflow è già visualizzato, l'amministratore del tenant potrebbe averla già abilitata.

  1. Passare alla sezione Portale di amministrazione -> Impostazioni tenant -> In Microsoft Fabric -> Espandere "Gli utenti possono creare e usare il processo Apache Airflow (anteprima)".
  2. Selezionare Applica.

Screenshot per abilitare Apache Airflow nel tenant.

Creare un processo Apache Airflow

  1. È possibile utilizzare un'area di lavoro esistente o creare una nuova area di lavoro.

  2. Espandere l'elenco + New a discesa -> Fare clic su Altre opzioni -> Nella Data Factory sezione -> Selezionare processo Apache Airflow (anteprima)

    Screenshot che mostra come fare clic su altre opzioni.

    Screenshot per selezionare Processo Apache Airflow.

  3. Assegnare un nome appropriato al progetto e fare clic sul pulsante "Crea".

Creare un file DAG

  1. Fare clic sulla scheda "Nuovo file DAG" -> assegnare il nome al file e fare clic sul pulsante "Crea".

    Screenshot che mostra come denominare un file DAG.

  2. Viene visualizzato un codice DAG boilerplate. È possibile modificare il file in base ai propri requisiti.

    Screenshot che mostra il file DAG boilerplate in Microsoft Fabric.

  3. Fare clic sull'icona "Salva".

    Screenshot che illustra come salvare il file DAG in Microsoft Fabric.

Eseguire un DAG

  1. Per iniziare, fare clic sul pulsante "Esegui DAG".

    Screenshot per eseguire il DAG dall'interfaccia utente dei flussi di lavoro dei dati.

  2. Dopo l'avvio, verrà visualizzata immediatamente una notifica che indica che il DAG è in esecuzione.

  3. Per monitorare lo stato di avanzamento dell'esecuzione del DAG, è sufficiente fare clic su "Visualizza dettagli" all'interno del centro notifiche. Questa azione reindirizzerà l'utente all'interfaccia utente di Apache Airflow, in cui è possibile tenere traccia dello stato e dei dettagli dell'esecuzione del DAG.

    Screenshot per passare all'interfaccia utente di Apache Airflow dal centro notifiche.

Monitorare il dag Apache Airflow nell'interfaccia utente di Apache Airflow

I file DAG salvati vengono caricati nell'interfaccia utente di Apache Airflow. È possibile monitorarli facendo clic sul pulsante "Monitora in Apache Airflow".

Screenshot per monitorare il DAG Airflow.

Screenshot che mostra il DAG Airflow caricato.