Del via


Hurtigstart: Flytte og transformere data med dataflyter og datasamlebånd

I denne opplæringen oppdager du hvordan dataflyten og datasamlebåndopplevelsen kan opprette en kraftig og omfattende datafabrikkløsning.

Forutsetninger

Du må ha følgende forutsetninger for å komme i gang:

Dataflyter sammenlignet med datasamlebånd

Med Dataflyter Gen2 kan du bruke et grensesnitt med lav kode og 300 + data og AI-baserte transformasjoner til deg enkelt å rengjøre, klargjøre og transformere data med mer fleksibilitet enn noe annet verktøy. Datasamlebånd gjør det mulig for rike ut-av-boksen-dataorkestreringsfunksjoner å skrive fleksible dataarbeidsflyter som oppfyller bedriftens behov. I et datasamlebånd kan du opprette logiske grupperinger av aktiviteter som utfører en oppgave, som kan omfatte å kalle en dataflyt for å rydde opp i og klargjøre dataene. Selv om det er noe funksjonalitetsoverlapping mellom de to, avhenger valget som skal brukes for et bestemt scenario, av om du krever full rikdom av datasamlebånd eller kan bruke de enklere, men mer begrensede egenskapene til dataflyter. Hvis du vil ha mer informasjon, kan du se beslutningsveiledningen for Fabric

Transformere data med dataflyter

Følg disse trinnene for å konfigurere dataflyten.

Trinn 1: Opprette en dataflyt

  1. Velg det stoffaktiverte arbeidsområdet, og velg deretter Ny. Velg deretter Dataflyt gen2.

    Skjermbilde som viser hvor du kan begynne å opprette en dataflyt gen2.

  2. Vinduet for redigeringsprogrammet for dataflyt vises. Velg Importer fra SQL Server-kortet.

    Skjermbilde som viser vinduet for redigeringsprogrammet for dataflyt.

Trinn 2: Hent data

  1. Skriv inn detaljene for å koble til Azure SQL-databasen i dialogboksen Koble til datakilde som vises, og velg deretter Neste. I dette eksemplet bruker du AdventureWorksLT- eksempeldatabase som er konfigurert da du konfigurerte Azure SQL-databasen i forutsetningene.

    Skjermbilde som viser hvordan du kobler til en Azure SQL-database.

  2. Velg dataene du vil transformere, og velg deretter Opprett. For denne hurtigstarten velger du SalesLT.Customer fra AdventureWorksLT eksempeldata for Azure SQL DB, og deretter Velg relaterte tabeller-knappen for automatisk å inkludere to andre relaterte tabeller.

    Skjermbilde som viser hvor du kan velge mellom de tilgjengelige dataene.

Trinn 3: Transformere dataene

  1. Hvis det ikke er valgt, velger du diagramvisning-knappen langs statuslinjen nederst på siden, eller velger diagramvisning under Vis-menyen øverst i redigeringsprogrammet for Power Query. Ett av disse alternativene kan veksle diagramvisningen.

    Skjermbilde som viser hvor du velger diagramvisning.

  2. Høyreklikk spørringen SalesLT Customer, eller velg den loddrette ellipsen til høyre for spørringen, og velg deretter Slå sammen spørringer.

    Skjermbilde som viser hvor du finner alternativet Slå sammen spørringer.

  3. Konfigurer flettingen ved å velge SalesLTOrderHeader-tabellen som den riktige tabellen for flettingen, kolonnen CustomerID fra hver tabell som sammenføyningskolonne, og venstre ytre som sammenføyningstype. Velg deretter OK for å legge til flettespørringen.

    Skjermbilde av skjermbildet Slå sammen konfigurasjon.

  4. Velg Knappen Legg til datamål, som ser ut som et databasesymbol med en pil over, fra den nye flettespørringen du opprettet. Velg deretter Azure SQL-database som måltype.

    Skjermbilde som uthever knappen Legg til datamål i den nyopprettede flettespørringen.

  5. Oppgi detaljene for Azure SQL-databasetilkoblingen der flettespørringen skal publiseres. I dette eksemplet kan du bruke AdventureWorksLT- databasen vi brukte som datakilde for målet også.

    Skjermbilde som viser dialogboksen Koble til datamål med eksempelverdier fylt ut.

  6. Velg en database for å lagre dataene, og angi et tabellnavn, og velg deretter Neste.

    Skjermbilde som viser målvinduet Velg mål.

  7. Du kan la standardinnstillingene stå på dialogboksen Velg målinnstillinger, og bare velge Lagre innstillinger uten å gjøre noen endringer her.

    Skjermbilde som viser dialogboksen Velg målinnstillinger.

  8. Velg Publiser tilbake på redigeringssiden for dataflyten for å publisere dataflyten.

    Skjermbilde som uthever Publiser-knappen i redigeringsprogrammet for dataflyt gen2.

Flytte data med datasamlebånd

Nå som du har opprettet en dataflyt gen2, kan du operere på den i et datasamlebånd. I dette eksemplet kopierer du dataene som genereres fra dataflyten, til tekstformat i en Azure Blob Storage-konto.

Trinn 1: Opprette et nytt datasamlebånd

  1. Velg Nyfra arbeidsområdet, og velg deretter Dataforløp.

    Skjermbilde som viser hvor du starter et nytt datasamlebånd.

  2. Gi navn til datasamlebåndet, og velg deretter Opprett.

    Skjermbilde som viser den nye ledeteksten for oppretting av datasamlebånd med et eksempel på datasamlebåndnavn.

Trinn 2: Konfigurere dataflyten

  1. Legg til en ny dataflytaktivitet i datasamlebåndet ved å velge Dataflyt- i Aktiviteter-fanen.

    Skjermbilde som viser hvor du velger dataflytalternativet.

  2. Velg dataflyten på datasamlebåndlerretet, og velg deretter fanen Innstillinger. Velg dataflyten du opprettet tidligere fra rullegardinlisten.

    Skjermbilde som viser hvordan du velger dataflyten du opprettet.

  3. Velg Lagre, og kjør for å kjøre dataflyten for å fylle ut den sammenslåtte spørringstabellen du utformet i forrige trinn.

    Skjermbilde som viser hvor du velger Kjør.

Trinn 3: Bruke kopieringsassistenten til å legge til en kopiaktivitet

  1. Velg Kopier data på lerretet for å åpne verktøyet Kopier hjelper for å komme i gang. Eller velg Bruk kopieringsassistent fra rullegardinlisten Kopier data under fanen Aktiviteter på båndet.

    Skjermbilde som viser de to måtene å få tilgang til kopiassistenten på.

  2. Velg datakilden ved å velge en datakildetype. I denne opplæringen bruker du Azure SQL Database som ble brukt tidligere da du opprettet dataflyten for å generere en ny flettespørring. Rull ned under eksempeldatatilbudene, og velg Azure-fanen, og deretter Azure SQL Database. Velg deretter Neste for å fortsette.

    Skjermbilde som viser hvor du velger en datakilde.

  3. Opprett en tilkobling til datakilden ved å velge Opprett ny tilkobling. Fyll ut den nødvendige tilkoblingsinformasjonen i panelet, og skriv inn AdventureWorksLT for databasen, der vi genererte flettespørringen i dataflyten. Velg deretter Neste.

    Skjermbilde som viser hvor du oppretter en ny tilkobling.

  4. Velg tabellen du genererte i dataflyttrinnet tidligere, og velg deretter Neste.

    Skjermbilde som viser hvordan du velger fra tilgjengelige tabeller.

  5. Velg Azure Blob Storage for målet, og velg deretter Neste.

    Skjermbilde som viser azure Blob Storage-datamålet.

  6. Opprett en tilkobling til målet ved å velge Opprett ny tilkobling. Angi detaljene for tilkoblingen, og velg deretter Neste.

    Skjermbilde som viser hvordan du oppretter en tilkobling.

  7. Velg mappebane, og angi et Filnavn, og velg deretter Neste.

    Skjermbilde som viser hvordan du velger mappebane og filnavn.

  8. Velg Neste på nytt for å godta standard filformat, kolonneskilletegn, radskilletegn og komprimeringstype, eventuelt inkludert en topptekst.

    Skjermbilde som viser konfigurasjonsalternativene for filen i Azure Blob Storage.

  9. Fullfør innstillingene. Deretter kan du se gjennom og velge Lagre + Kjør for å fullføre prosessen.

    Skjermbilde som viser hvordan du ser gjennom innstillingene for kopiering av data.

Trinn 5: Utforme datasamlebåndet og lagre for å kjøre og laste inn data

  1. Hvis du vil kjøre aktiviteten Kopier etter dataflyt, drar du fra Vellykketdataflytaktiviteten til aktiviteten Kopier. Aktiviteten Kopier kjører bare etter at dataflytaktiviteten lykkes.

    Skjermbilde som viser hvordan du får dataflyten til å kjøre etter kopiaktiviteten.

  2. Velg Lagre for å lagre datasamlebåndet. Velg deretter Kjør for å kjøre datasamlebåndet og laste inn dataene.

    Skjermbilde som viser hvor du velger Lagre og kjør.

Planlegg kjøring av datasamlebånd

Når du er ferdig med å utvikle og teste datasamlebåndet, kan du planlegge at det skal kjøres automatisk.

  1. Velg Planleggpå fanen Hjem i vinduet for datasamlebåndredigering.

    Et skjermbilde av Tidsplan-knappen på menyen på Hjem-fanen i redigeringsprogrammet for datasamlebånd.

  2. Konfigurer tidsplanen etter behov. Eksemplet her planlegger at datasamlebåndet skal kjøre daglig klokken 20:00 frem til slutten av året.

    Skjermbilde som viser tidsplankonfigurasjonen for at et datasamlebånd skal kjøre daglig klokken 20:00 frem til slutten av året.

Dette eksemplet viser deg hvordan du oppretter og konfigurerer en Dataflyt gen2 til å opprette en flettespørring og lagre den i en Azure SQL-database, og deretter kopiere data fra databasen til en tekstfil i Azure Blob Storage. Du lærte å gjøre følgende:

  • Opprett en dataflyt.
  • Transformer data med dataflyten.
  • Opprett et datasamlebånd ved hjelp av dataflyten.
  • Bestill utførelsen av trinnene i datasamlebåndet.
  • Kopier data med kopieringsassistenten.
  • Kjør og planlegg datasamlebåndet.

Deretter kan du gå videre for å lære mer om overvåking av datasamlebåndkjøringer.