Del via


Modul 1: Opret en pipeline med Data Factory

Dette modul tager 10 minutter, hvor rå data fra kildelageret indtages i bronzetabellen i et data Lakehouse ved hjælp af aktiviteten Kopiér i en pipeline.

Trinnene på højt niveau i modul 1 er som følger:

  1. Opret en datapipeline.
  2. Brug en Kopiér aktivitet i pipelinen til at indlæse eksempeldata i et data Lakehouse.

Opret en datapipeline

  1. Der kræves en Microsoft Fabric-lejerkonto med et aktivt abonnement. Opret en gratis konto.

  2. Sørg for, at du har et Arbejdsområde, der er aktiveret af Microsoft Fabric: Opret et arbejdsområde.

  3. Log på Power BI-.

  4. Vælg power BI-standardikonet nederst til venstre på skærmen, og skift til Data Factory.eks.

    Skærmbillede, der viser valget af Data Factory-oplevelsen.

  5. Vælg Datapipeline, og angiv et pipelinenavn. Vælg derefter Opret.

    Skærmbillede af datafabrikkens startside med knappen for at oprette en ny datapipeline valgt.

    Skærmbillede, der viser dialogboksen for at give den nye pipeline et navn.

Brug en kopiaktivitet i pipelinen til at indlæse eksempeldata i et data Lakehouse

Trin 1: Brug kopiassistenten til at konfigurere en kopiaktivitet.

Vælg Kopiér dataassistent for at åbne kopiassistentværktøjet.

Skærmbillede, der viser valget af siden Kopiér dataaktivitet fra den nye pipelinestartside.

Trin 2: Konfigurer dine indstillinger i kopiassistenten.

  1. Dialogboksen Kopiér data vises med det første trin Vælg datakildefremhævet. Vælg Eksempeldata fra indstillingerne øverst i dialogboksen, og vælg derefter NYC Taxi – Grøn.

    Skærmbillede, der viser valget af NYC Taxi – Grønne data i kopiassistenten under fanen Vælg datakilde.

  2. Eksempelvisningen af datakilden vises næste på siden Opret forbindelse til datakilde. Gennemse, og vælg derefter Næste.

    Skærmbillede, der viser eksempeldataene for DATASÆTTET NYC Taxi – Green Sample.

  3. For Vælg datadestination trin i kopiassistenten skal du vælge Lakehouse- og derefter Næste.

    Skærmbillede, der viser valget af Lakehouse-destinationen under fanen Vælg datadestination i Kopiér dataassistent.

  4. Vælg Opret nyt Lakehouse- på den viste konfigurationsside for datadestinationen, og angiv et navn til det nye Lakehouse. Vælg derefter Næste igen.

    Skærmbillede, der viser konfigurationssiden for datadestinationen for Kopiér assistent, og vælg indstillingen Opret ny Lakehouse og angiv et Lakehouse-navn.

  5. Konfigurer nu detaljerne for din Lakehouse-destination på Vælg, og knyt til mappesti eller -tabel. side. Vælg Tabeller for rodmappen, angiv et tabelnavn, og vælg handlingen Overskriv. Markér ikke afkrydsningsfeltet Aktivér partition, der vises, når du har valgt handlingen Overskriv tabel.

    Skærmbillede, der viser fanen Opret forbindelse til datadestination i Kopiér dataassistent i trinnet Vælg og knyt til mappesti eller tabel.

  6. Gennemse konfigurationen på siden Gennemse + gem i kopidataassistenten. I dette selvstudium skal du fjerne markeringen i afkrydsningsfeltet Start dataoverførsel med det samme, da vi kører aktiviteten manuelt i næste trin. Vælg derefter OK.

    Skærmbillede, der viser Kopiér dataassistent på siden Gennemse + gem.

Trin 3: Kør og få vist resultaterne af din kopiaktivitet.

  1. Vælg fanen Kør i pipelineeditoren. Vælg derefter knappen Kør, og derefter Gem og kør ved prompten for at køre aktiviteten Kopiér.

    Skærmbillede, der viser fanen Kør pipeline med knappen Kør fremhævet.

    Skærmbillede, der viser dialogboksen Gem og kør med knappen Gem og kør fremhævet.

  2. Du kan overvåge kørslen og kontrollere resultaterne på fanen Output under pipelinelærredet. Vælg knappen kørselsoplysninger (ikonet "briller", der vises, når du holder markøren over den kørende pipelinekørsel) for at få vist kørselsoplysningerne.

    Skærmbillede, der viser knappen med kørselsoplysninger under fanen Pipelineoutput.

  3. Kørselsdetaljerne viser 1.508.501 rækker læst og skrevet.

    Skærmbillede af kopiér dataoplysninger for pipelinekørslen.

  4. Udvid afsnittet varighed for at se varigheden af hver fase i kopiaktiviteten. Når du har gennemset kopioplysningerne, skal du vælge Luk.

    Skærmbillede, der viser varighedsopdelingen af kørslen af Kopiér aktivitet.

I dette første modul til vores komplette selvstudium om din første dataintegration ved hjælp af Data Factory i Microsoft Fabric har du lært, hvordan du:

  • Opret en datapipeline.
  • Føj en kopiaktivitet til din pipeline.
  • Brug eksempeldata, og opret et data Lakehouse for at gemme dataene i en ny tabel.
  • Kør pipelinen, og få vist dens detaljer og varighedsopdeling.

Fortsæt til næste afsnit nu for at oprette dit dataflow.