Dela via


Snabbstart: Skapa ett Apache Airflow-jobb

Kommentar

Apache Airflow-jobbet drivs av Apache Airflow.
Apache Airflow är en plattform med öppen källkod som används för att programmatiskt skapa, schemalägga och övervaka komplexa jobb. Det gör att du kan definiera en uppsättning uppgifter, så kallade operatorer, som kan kombineras till riktade acykliska grafer (DAG:er) för att representera datapipelines.

Apache Airflow Job är ett enkelt och effektivt sätt att skapa och hantera Apache Airflow-miljöer så att du enkelt kan köra orkestreringsjobben i stor skala. I den här snabbstarten ska vi skapa ett enkelt Apache Airflow-jobb för att bekanta dig med miljön och funktionerna i Apache Airflow-jobbet.

Förutsättningar

  • Aktivera Apache Airflow-jobb i klientorganisationen.

Kommentar

Eftersom Apache Airflow-jobbet är i förhandsversionstillstånd måste du aktivera det via klientadministratören. Om du redan ser Apache Airflow-jobb kanske klientadministratören redan har aktiverat det.

  1. Gå till administratörsportalen –> Klientinställningar –> Under Microsoft Fabric –> Expandera avsnittet Användare kan skapa och använda Apache Airflow-jobb (förhandsversion).
  2. Välj Använd.

Skärmbild för att aktivera Apache Airflow i klientorganisationen.

Skapa ett Apache Airflow-jobb

  1. Du kan använda en befintlig arbetsyta eller Skapa en ny arbetsyta.

  2. Expandera + New listrutan –> Klicka på Fler alternativ –> Under Data Factory avsnittet –> Välj Apache Airflow-jobb (förhandsversion)

    Skärmbild som visar klicka på fler alternativ.

    Skärmbild för att välja Apache Airflow-jobb.

  3. Ge projektet ett lämpligt namn och klicka på knappen "Skapa".

Skapa en DAG-fil

  1. Klicka på kortet "Ny DAG-fil" –> ge filen namnet och klicka på knappen "Skapa".

    Skärmbild som namnger DAG-filen.

  2. En BOILERPLATE DAG-kod visas för dig. Du kan redigera filen enligt dina behov.

    Skärmbild som visar FILEN BOILERPLATE DAG i Microsoft Fabric.

  3. Klicka på "Spara ikon".

    Skärmbild som visar hur du sparar DAG-filen i Microsoft Fabric.

Kör en DAG

  1. Börja med att klicka på knappen "Kör DAG".

    Skärmbild för att köra DAG från användargränssnittet för dataarbetsflöden.

  2. När det har initierats visas ett meddelande som anger att DAG körs.

  3. Om du vill övervaka förloppet för DAG-körningen klickar du bara på "Visa information" i meddelandecentret. Den här åtgärden omdirigerar dig till Apache Airflow-användargränssnittet, där du enkelt kan spåra status och information om DAG-körningen.

    Skärmbild för att navigera till Apache Airflow-användargränssnittet från meddelandecentret.

Övervaka din Apache Airflow DAG i Apache Airflow-användargränssnittet

De sparade dagfilerna läses in i Apache Airflow-användargränssnittet. Du kan övervaka dem genom att klicka på knappen "Övervaka i Apache Airflow".

Skärmbild för att övervaka Airflow DAG.

Skärmbild som visar den inlästa Airflow DAG.