Del via


Hurtig start: Opret dit første dataflow for at hente og transformere data

Dataflow er en selvbetjent, cloudbaseret teknologi til dataforberedelse. I denne artikel opretter du dit første dataflow, henter data til dit dataflow, transformerer derefter dataene og publicerer dataflowet.

Forudsætninger

Der kræves følgende forudsætninger, før du starter:

Oprette et dataflow

I dette afsnit opretter du dit første dataflow.

  1. Skift til datafabrikken.

  2. Gå til dit Microsoft Fabric-arbejdsområde.

    Skærmbillede af vinduet arbejdsområder, hvor du navigerer til dit arbejdsområde.

  3. Vælg Ny, og vælg derefter Dataflow Gen2.

    Skærmbillede med valget Dataflow Gen2 fremhævet.

Hent data

Lad os hente nogle data! I dette eksempel henter du data fra en OData-tjeneste. Brug følgende trin til at hente data i dit dataflow.

  1. I datafloweditoren skal du vælge Hent data og derefter vælge Mere.

    Skærmbillede med indstillingen Hent data valgt og Mere fremhævet på rullelisten.

  2. Vælg Vis mere i Vælg datakilde.

    Skærmbillede af Hent datakilde med Vis mere fremhævet.

  3. I Ny kilde skal du vælge Andre>OData som datakilde.

    Skærmbillede af Hent datakilde med kategorien Andet og OData-connectoren fremhævet.

  4. Angiv URL-adressen https://services.odata.org/v4/northwind/northwind.svc/, og vælg derefter Næste.

    Skærmbillede af OData-datakilden, hvor du angiver data-URL-adressen.

  5. Vælg tabellerne Orders og Customers, og vælg derefter Opret.

    Skærmbillede af Power Query-navigatoren med tabellerne Kunder og Ordrer fremhævet.

Du kan få mere at vide om hent dataoplevelsen og -funktionaliteten under Oversigt over hentning af data.

Anvend transformationer, og publicer

Du har indlæst dine data i dit første dataflow nu. Tillykke! Nu er det tid til at anvende et par transformationer for at få disse data ind i den ønskede form.

Du udfører denne opgave fra Power Query-editoren. Du kan finde en detaljeret oversigt over Power Query-editoren på Brugergrænsefladen i Power Query.

Følg disse trin for at anvende transformationer og publicere:

  1. Sørg for, at værktøjerne til dataprofilering er aktiveret ved at gå til

    Skærmbillede af globale indstillinger med fremhævet valg af kolonneprofil.

    Sørg også for at aktivere diagramvisning ved hjælp af indstillingerne under fanen Vis på båndet i Power Query-editor eller ved at vælge ikonet diagramvisning nederst til højre i Power Query-vinduet.

    Skærmbillede af det overordnede udseende af Power Query-diagramvisning.

  2. I tabellen Orders beregner du det samlede antal ordrer pr. kunde. For at nå dette mål skal du vælge kolonnen Kunde-id i dataeksemplet og derefter vælge Gruppér efter under fanen Transformér på båndet.

    Skærmbillede, der viser tabellen Ordrer valgt, og Gruppér efter under fanen Transformér.

  3. Du udfører en optælling af rækker som sammenlægningen i Gruppér efter. Du kan få mere at vide om Gruppér efter-funktioner under Gruppering eller opsummering af rækker.

    Skærmbillede af Gruppér efter, hvor handlingen Antal rækker er valgt.

  4. Efter gruppering af data i tabellen Orders henter vi en tabel med to kolonner med CustomerID og Count som kolonnerne.

    Skærmbillede af tabellen med to kolonner.

  5. Derefter skal du kombinere data fra tabellen Kunder med Antal ordrer pr. kunde. Hvis du vil kombinere data, skal du vælge forespørgslen Kunder i diagramvisningen og bruge menuen "⋮" til at få adgang til Flet forespørgsler som ny transformation.

    Skærmbillede af datafloweditoren med den lodrette ellipse i tabellen Customers og Flet forespørgsler som ny fremhævet.

  6. Konfigurer handlingen Flet som vist på følgende skærmbillede ved at vælge Kunde-id som den tilsvarende kolonne i begge tabeller. Vælg derefter OK.

    Skærmbillede af vinduet Flet.

    Skærmbillede af vinduet Flet, hvor venstre tabel til fletning er angivet til tabellen Kunder, og tabellen Højre til fletning er angivet til tabellen Orders. Kolonnen CustomerID vælges for tabellerne Customers og Orders. Join-typen er også indstillet til Venstre ydre. Alle andre markeringer er angivet til standardværdien.

  7. Når du udfører fletforespørgslerne som en ny handling, får du en ny forespørgsel med alle kolonner fra tabellen Kunder og én kolonne med indlejrede data fra tabellen Orders.

    Skærmbillede af datafloweditoren, hvor den nye fletforespørgsel er føjet til højre for tabellerne Kunder og Ordrer.

  8. I dette eksempel er du kun interesseret i et undersæt af kolonner i tabellen Kunder. Du vælger disse kolonner ved hjælp af skemavisningen. Aktivér skemavisningen i til/fra-knappen i nederste højre hjørne af datafloweditoren.

    Skærmbillede af datafloweditoren med knappen skemavisning fremhævet i nederste højre hjørne.

  9. Skemavisningen giver en fokuseret visning i en tabels skemaoplysninger, herunder kolonnenavne og datatyper. Skemavisning har et sæt skemaværktøjer tilgængelige via en kontekstafhængig båndfane. I dette scenarie skal du vælge kolonnerne CustomerID, CompanyName og Orders (2), derefter vælge knappen Fjern kolonner og derefter vælge Fjern andre kolonner under fanen Skemaværktøjer.

    Skærmbillede af skemavisningen, der viser alle de tilgængelige kolonnenavne, hvor kolonnerne CustomerID, CompanyName og Orders (2) er fremhævet.

    Skærmbillede af menuen med skemaværktøjer, hvor Fjern andre kolonner er fremhævet.

  10. Kolonnen Orders (2) indeholder indlejrede oplysninger, der stammer fra den flettehandling, du udførte for et par trin siden. Skift nu tilbage til datavisningen ved at vælge knappen Vis datavisning ud for knappen Vis skemavisning i nederste højre hjørne af brugergrænsefladen. Brug derefter transformationen Udvid kolonne i kolonneoverskriften Orders (2) til at vælge kolonnen Count .

    Skærmbillede til brug af datavisning.

  11. Som den sidste handling vil du rangere dine kunder på baggrund af deres antal ordrer. Vælg kolonnen Antal , og vælg derefter knappen Rangeringskolonne under fanen Tilføj kolonne på båndet.

    Skærmbillede af datafloweditoren, hvor kolonnen Antal er valgt.

  12. Bevar standardindstillingerne i Rangeringskolonne. Vælg derefter OK for at anvende denne transformation.

    Skærmbillede af vinduet Rangering, hvor alle standardindstillinger vises.

  13. Omdøb nu den resulterende forespørgsel til Rangerede kunder ved hjælp af ruden Forespørgselsindstillinger i højre side af skærmen.

    Skærmbillede af datafloweditoren med navnet Rangerede kunder fremhævet under egenskaberne for forespørgselsindstillinger.

  14. Nu, hvor du er færdig med at transformere og kombinere dine data, kan du konfigurere indstillingerne for outputdestinationen. Vælg Vælg datadestination nederst i ruden Forespørgselsindstillinger .

    Skærmbillede af datafloweditoren, hvor placeringen af valget af datadestination er fremhævet.

  15. I dette trin kan du konfigurere et output til dit lakehouse, hvis du har et tilgængeligt, eller springe dette trin over, hvis du ikke gør det. I denne oplevelse kan du konfigurere destinationssøhuset og -tabellen for dine forespørgselsresultater ud over opdateringsmetoden (Tilføj eller Erstat).

    Skærmbillede af vinduet Opret forbindelse til datadestination med lakehouse valgt.

    Skærmbillede af vinduet Vælg destinationsindstillinger.

  16. Dit dataflow er nu klar til at blive publiceret. Gennemse forespørgslerne i diagramvisningen, og vælg derefter Publicer.

    Skærmbillede af datafloweditoren med knappen Publicer nederst til højre fremhævet.

    Du er nu vendt tilbage til arbejdsområdet. Et spinnerikon ud for navnet på dit dataflow angiver, at publiceringen er i gang. Når publiceringen er fuldført, er dit dataflow klar til opdatering!

    Vigtigt

    Når det første Dataflow Gen2 oprettes i et arbejdsområde, klargøres Lakehouse- og Warehouse-elementer sammen med deres relaterede SQL Analytics-slutpunkt og semantiske modeller. Disse elementer deles af alle dataflow i arbejdsområdet og er påkrævet, for at Dataflow Gen2 kan fungere, bør ikke slettes og er ikke beregnet til at blive brugt direkte af brugerne. Elementerne er en implementeringsdetaljer for Dataflow Gen2. Elementerne er ikke synlige i arbejdsområdet, men kan være tilgængelige i andre oplevelser, f.eks. Notebook, SQL Analytics-slutpunktet, Lakehouse og Warehouse. Du kan genkende elementerne med deres præfiks i navnet. Præfikset for elementerne er 'DataflowStaging'.

  17. Vælg ikonet Planlæg opdatering i dit arbejdsområde.

    Skærmbillede af arbejdsområdet med ikonet planlæg opdatering fremhævet.

  18. Slå den planlagte opdatering til, vælg Tilføj et andet tidspunkt, og konfigurer opdateringen som vist på følgende skærmbillede.

    Skærmbillede, der viser, hvordan du vælger et andet tidspunkt.

    Skærmbillede af indstillingerne for planlagt opdatering, hvor planlagt opdatering er slået til, opdateringshyppigheden angivet til Dagligt, tidszonen er angivet til koordineret universel tid, og klokkeslættet er angivet til 4:00. Knappen Til, Tilføj en anden tidsvalg, ejeren af dataflowet og knappen Anvend fremhæves alle.

Fjerne ressourcer

Hvis du ikke vil fortsætte med at bruge dette dataflow, skal du slette dataflowet ved hjælp af følgende trin:

  1. Gå til dit Microsoft Fabric-arbejdsområde.

    Skærmbillede af vinduet arbejdsområder, hvor du navigerer til dit arbejdsområde.

  2. Vælg den lodrette ellipse ud for navnet på dit dataflow, og vælg derefter Slet.

    Skærmbillede med de tre lodrette prikker og indstillingen Slet i rullemenuen fremhævet.

  3. Vælg Slet for at bekræfte sletningen af dit dataflow.

    Skærmbillede af vinduet Slet dataflow, hvor knappen Slet er fremhævet.

Dataflowet i dette eksempel viser, hvordan du indlæser og transformerer data i Dataflow Gen2. Du har lært, hvordan du:

  • Opret en Dataflow Gen2.
  • Transformér data.
  • Konfigurer destinationsindstillinger for transformerede data.
  • Kør og planlæg din datapipeline.

Gå videre til næste artikel for at få mere at vide om, hvordan du opretter din første datapipeline.