Del via


Hurtigstart: Opprett din første dataflyt for å hente og transformere data

Dataflyter er en selvbetjent, skybasert dataforberedelsesteknologi. I denne artikkelen oppretter du den første dataflyten, henter data for dataflyten, transformerer dataene og publiserer dataflyten.

Forutsetning

Følgende forutsetninger kreves før du starter:

Opprette en dataflyt

I denne delen oppretter du den første dataflyten.

  1. Bytt til datafabrikkopplevelsen .

  2. Gå til Microsoft Fabric-arbeidsområdet.

    Skjermbilde av vinduet for arbeidsområder der du navigerer til arbeidsområdet.

  3. Velg Ny, og velg deretter Dataflyt gen2.

    Skjermbilde med utvalget Dataflyt gen2 fremhevet.

Hent data

La oss få noen data! I dette eksemplet får du data fra en OData-tjeneste. Bruk følgende fremgangsmåte for å hente data i dataflyten.

  1. Velg Hent data i redigeringsprogrammet for dataflyt, og velg deretter Mer.

    Skjermbilde med alternativet Hent data valgt, og Mer fremhevet i rullegardinlisten.

  2. Velg Vis mer i Velg datakilde.

    Skjermbilde av Hent datakilde med Vis mer fremhevet.

  3. Velg som datakilde i Ny kilde.

    Skjermbilde av Hent datakilde med Andre-kategorien og OData-koblingen fremhevet.

  4. Skriv inn URL-adressen https://services.odata.org/v4/northwind/northwind.svc/, og velg deretter Neste.

    Skjermbilde av OData-datakilden der du skriver inn nettadressen for data.

  5. Velg ordre - og kundetabellene , og velg deretter Opprett.

    Skjermbilde av Power Query-navigatøren med tabellene Kunder og Ordrer fremhevet.

Du kan lære mer om hent dataopplevelsen og funksjonaliteten ved å få oversikt over data.

Bruke transformasjoner og publisere

Du har lastet inn dataene i den første dataflyten nå. Gratulerer! Nå er det på tide å bruke et par transformasjoner for å få disse dataene inn i ønsket figur.

Du gjør denne oppgaven fra redigeringsprogrammet for Power Query. Du finner en detaljert oversikt over power query-redigeringsprogrammet i Brukergrensesnittet i Power Query.

Følg disse trinnene for å bruke transformasjoner og publisere:

  1. Kontroller at dataprofileringsverktøyene er aktivert ved å navigere til .

    Skjermbilde av globale alternativer med kolonneprofilvalgene fremhevet.

    Kontroller også at du aktiverer diagramvisning ved hjelp av alternativene under fanen Vis på båndet i redigeringsprogrammet for Power Query, eller ved å velge diagramvisningsikonet nederst til høyre i Power Query-vinduet.

    Skjermbilde av det generelle utseendet til Power Query-diagramvisning.

  2. I Ordrer-tabellen beregner du det totale antallet ordrer per kunde. Hvis du vil oppnå dette målet, velger du CustomerID-kolonnen i forhåndsvisningen av data, og deretter velger du Grupper etter under Transformer-fanen på båndet.

    Skjermbilde som viser Ordrer-tabellen som er valgt, og Grupper etter fremhevet i Transformer-fanen.

  3. Du utfører et antall rader som aggregasjon i Grupper etter. Du kan lære mer om Group By-funksjoner ved gruppering eller oppsummering av rader.

    Skjermbilde av Grupper etter, der Antall rader-operasjonen er valgt.

  4. Når du har gruppert data i Ordrer-tabellen, får vi en tabell med to kolonner med CustomerID og Count som kolonner.

    Skjermbilde av tabellen med to kolonner.

  5. Deretter vil du kombinere data fra Kunder-tabellen med antall ordrer per kunde. Hvis du vil kombinere data, velger du Kunder-spørringen i diagramvisningen og bruker menyen «⋮» til å få tilgang til flettespørringene som ny transformasjon.

    Skjermbilde av redigeringsprogrammet for dataflyt, med den loddrette ellipsen i Kunder-tabellen og Slå sammen spørringer som ny fremhevet.

  6. Konfigurer sammenslåingsoperasjonen som vist i skjermbildet nedenfor ved å velge CustomerID som samsvarende kolonne i begge tabellene. Deretter velger du Ok.

    Skjermbilde av Flett-vinduet.

    Skjermbilde av Flett-vinduet, med Venstre-tabellen for fletting satt til Kunder-tabellen og Høyre-tabellen for fletting satt til Ordrer-tabellen. CustomerID-kolonnen er valgt for både Kunder- og Ordrer-tabellene. Sammenføyningstype er også satt til Venstre ytre. Alle andre valg er satt til standardverdien.

  7. Når du utfører flettespørringene som ny operasjon, får du en ny spørring med alle kolonner fra Kunder-tabellen og én kolonne med nestede data fra Ordrer-tabellen.

    Skjermbilde av redigeringsprogrammet for dataflyter med den nye flettespørringen lagt til til høyre for tabellene Kunder og Ordrer.

  8. I dette eksemplet er du bare interessert i et delsett med kolonner i Kunder-tabellen. Du velger disse kolonnene ved hjelp av skjemavisningen. Aktiver skjemavisningen i veksleknappen nederst til høyre i redigeringsprogrammet for dataflyter.

    Skjermbilde av redigeringsprogrammet for dataflyter med skjemavisningsknappen fremhevet nederst til høyre.

  9. Skjemavisningen gir en fokusert visning i skjemainformasjonen for en tabell, inkludert kolonnenavn og datatyper. Skjemavisning har et sett med skjemaverktøy tilgjengelig via en kontekstavhengig båndfane. I dette scenarioet velger du kolonnene CustomerID, CompanyName og Orders (2), deretter velger du Fjern kolonner-knappen , og deretter velger du Fjern andre kolonner i kategorien Skjemaverktøy .

    Skjermbilde av skjemavisningen som viser alle tilgjengelige kolonnenavn, med kolonnene CustomerID, CompanyName og Orders (2) fremhevet.

    Skjermbilde av menyen for skjemaverktøy med Fjern andre kolonner fremhevet.

  10. Ordrer (2)-kolonnen inneholder nestet informasjon som følge av fletteoperasjonen du utførte for noen få trinn siden. Bytt tilbake til datavisningen ved å velge Vis datavisning-knappen ved siden av Vis skjemavisning-knappen nederst til høyre i brukergrensesnittet. Bruk deretter utvid kolonnetransformasjonen i kolonneoverskriften Ordrer (2) til å velge Antall-kolonnen.

    Skjermbilde for bruk av datavisning.

  11. Som den endelige operasjonen vil du rangere kundene basert på antall bestillinger. Velg Antall-kolonnen, og velg deretter Rangering-kolonneknappen under Legg til kolonne-fanen på båndet.

    Skjermbilde av redigeringsprogrammet for dataflyter med Antall-kolonnen valgt.

  12. Behold standardinnstillingene i Rangeringskolonne. Velg deretter OK for å bruke denne transformasjonen.

    Skjermbilde av Rangering-vinduet med alle standardinnstillingene vist.

  13. Gi den resulterende spørringen nytt navn som rangerte kunder ved hjelp av ruten for spørringsinnstillinger på høyre side av skjermen.

    Skjermbilde av redigeringsprogrammet for dataflyter med rangert kundenavn fremhevet under egenskapene for spørringsinnstillinger.

  14. Nå som du er ferdig med å transformere og kombinere dataene, kan du konfigurere innstillingene for utdatamål. Velg Velg datamål nederst i ruten for spørringsinnstillinger .

    Skjermbilde av redigeringsprogrammet for dataflyter med plasseringen av datamålvalget fremhevet.

  15. For dette trinnet kan du konfigurere en utdata til lakehouse hvis du har en tilgjengelig, eller hoppe over dette trinnet hvis du ikke gjør det. I denne opplevelsen kan du konfigurere målsjøen og tabellen for spørringsresultatene, i tillegg til oppdateringsmetoden (Tilføy eller erstatt).

    Skjermbilde av vinduet Koble til datamål med lakehouse valgt.

    Skjermbilde av vinduet Velg målinnstillinger.

  16. Dataflyten er nå klar til å publiseres. Se gjennom spørringene i diagramvisningen, og velg deretter Publiser.

    Skjermbilde av redigeringsprogrammet for dataflyter med Publiser-knappen nederst til høyre fremhevet.

    Du er nå returnert til arbeidsområdet. Et spinnerikon ved siden av dataflytnavnet indikerer at publisering pågår. Når publiseringen er fullført, er dataflyten klar til oppdatering!

    Viktig

    Når den første dataflyten Gen2 opprettes i et arbeidsområde, klargjøres Lakehouse- og Warehouse-elementer sammen med relaterte SQL Analytics-endepunkt og semantiske modeller. Disse elementene deles av alle dataflyter i arbeidsområdet og kreves for at Dataflyt gen2 skal fungere, bør ikke slettes, og er ikke ment å brukes direkte av brukere. Elementene er en implementeringsdetalj for Dataflyt gen2. Elementene er ikke synlige i arbeidsområdet, men kan være tilgjengelige i andre opplevelser, for eksempel notatblokken, SQL Analytics-endepunktet, Lakehouse- og Warehouse-opplevelsene. Du kan gjenkjenne elementene ved hjelp av prefikset i navnet. Prefikset for elementene er Dataflytsstaging.

  17. Velg Ikonet Planlegg oppdatering i arbeidsområdet.

    Skjermbilde av arbeidsområdet med ikonet for tidsplanoppdatering fremhevet.

  18. Aktiver den planlagte oppdateringen, velg Legg til et nytt tidspunkt, og konfigurer oppdateringen som vist i skjermbildet nedenfor.

    Skjermbilde som viser hvordan du velger en annen gang.

    Skjermbilde av de planlagte oppdateringsalternativene, med planlagt oppdatering aktivert, oppdateringshyppigheten satt til Daglig, Tidssone satt til koordinert universell tid og klokkeslettet satt til 04:00. På-knappen, legg til et annet tidsvalg, eieren av dataflyten og bruk-knappen fremheves.

Fjerning av ressurser

Hvis du ikke skal fortsette å bruke denne dataflyten, sletter du dataflyten ved hjelp av følgende fremgangsmåte:

  1. Gå til Microsoft Fabric-arbeidsområdet.

    Skjermbilde av vinduet for arbeidsområder der du navigerer til arbeidsområdet.

  2. Velg den loddrette ellipsen ved siden av navnet på dataflyten, og velg deretter Slett.

    Skjermbilde med de tre loddrette prikkene og slettingsalternativet i rullegardinmenyen fremhevet.

  3. Velg Slett for å bekrefte slettingen av dataflyten.

    Skjermbilde av Slett dataflyt-vinduet, med Slett-knappen fremhevet.

Dataflyten i dette eksemplet viser deg hvordan du laster inn og transformerer data i Dataflyt gen2. Du lærte hvordan du:

  • Opprett en dataflyt-gen2.
  • Transformer data.
  • Konfigurer målinnstillinger for transformerte data.
  • Kjør og planlegg datasamlebåndet.

Gå videre til neste artikkel for å lære hvordan du oppretter det første datasamlebåndet.