Hurtigstart: Flytte og transformere data med dataflyter og datasamlebånd
I denne opplæringen oppdager du hvordan dataflyten og datasamlebåndopplevelsen kan opprette en kraftig og omfattende datafabrikkløsning.
Forutsetninger
Du må ha følgende forutsetninger for å komme i gang:
- En leierkonto med et aktivt abonnement. Opprett en gratiskonto.
- Kontroller at du har et Microsoft Fabric-aktivert arbeidsområde: Opprett et arbeidsområde som ikke er standard mitt arbeidsområde.
- En Azure SQL-database med tabelldata.
- en Blob Storage-konto.
Dataflyter sammenlignet med datasamlebånd
Med Dataflyter Gen2 kan du bruke et grensesnitt med lav kode og 300 + data og AI-baserte transformasjoner til deg enkelt å rengjøre, klargjøre og transformere data med mer fleksibilitet enn noe annet verktøy. Datasamlebånd gjør det mulig for rike ut-av-boksen-dataorkestreringsfunksjoner å skrive fleksible dataarbeidsflyter som oppfyller bedriftens behov. I et datasamlebånd kan du opprette logiske grupperinger av aktiviteter som utfører en oppgave, som kan omfatte å kalle en dataflyt for å rydde opp i og klargjøre dataene. Selv om det er noe funksjonalitetsoverlapping mellom de to, avhenger valget som skal brukes for et bestemt scenario, av om du krever full rikdom av datasamlebånd eller kan bruke de enklere, men mer begrensede egenskapene til dataflyter. Hvis du vil ha mer informasjon, kan du se beslutningsveiledningen for Fabric
Transformere data med dataflyter
Følg disse trinnene for å konfigurere dataflyten.
Trinn 1: Opprette en dataflyt
Velg det stoffaktiverte arbeidsområdet, og velg deretter Ny. Velg deretter Dataflyt gen2.
Vinduet for redigeringsprogrammet for dataflyt vises. Velg Importer fra SQL Server-kortet.
Trinn 2: Hent data
Skriv inn detaljene for å koble til Azure SQL-databasen i dialogboksen Koble til datakilde som vises, og velg deretter Neste. I dette eksemplet bruker du AdventureWorksLT- eksempeldatabase som er konfigurert da du konfigurerte Azure SQL-databasen i forutsetningene.
Velg dataene du vil transformere, og velg deretter Opprett. For denne hurtigstarten velger du SalesLT.Customer fra AdventureWorksLT eksempeldata for Azure SQL DB, og deretter Velg relaterte tabeller-knappen for automatisk å inkludere to andre relaterte tabeller.
Trinn 3: Transformere dataene
Hvis det ikke er valgt, velger du diagramvisning-knappen langs statuslinjen nederst på siden, eller velger diagramvisning under Vis-menyen øverst i redigeringsprogrammet for Power Query. Ett av disse alternativene kan veksle diagramvisningen.
Høyreklikk spørringen SalesLT Customer, eller velg den loddrette ellipsen til høyre for spørringen, og velg deretter Slå sammen spørringer.
Konfigurer flettingen ved å velge SalesLTOrderHeader-tabellen som den riktige tabellen for flettingen, kolonnen CustomerID fra hver tabell som sammenføyningskolonne, og venstre ytre som sammenføyningstype. Velg deretter OK for å legge til flettespørringen.
Velg Knappen Legg til datamål, som ser ut som et databasesymbol med en pil over, fra den nye flettespørringen du opprettet. Velg deretter Azure SQL-database som måltype.
Oppgi detaljene for Azure SQL-databasetilkoblingen der flettespørringen skal publiseres. I dette eksemplet kan du bruke AdventureWorksLT- databasen vi brukte som datakilde for målet også.
Velg en database for å lagre dataene, og angi et tabellnavn, og velg deretter Neste.
Du kan la standardinnstillingene stå på dialogboksen Velg målinnstillinger, og bare velge Lagre innstillinger uten å gjøre noen endringer her.
Velg Publiser tilbake på redigeringssiden for dataflyten for å publisere dataflyten.
Flytte data med datasamlebånd
Nå som du har opprettet en dataflyt gen2, kan du operere på den i et datasamlebånd. I dette eksemplet kopierer du dataene som genereres fra dataflyten, til tekstformat i en Azure Blob Storage-konto.
Trinn 1: Opprette et nytt datasamlebånd
Velg Nyfra arbeidsområdet, og velg deretter Dataforløp.
Gi navn til datasamlebåndet, og velg deretter Opprett.
Trinn 2: Konfigurere dataflyten
Legg til en ny dataflytaktivitet i datasamlebåndet ved å velge Dataflyt- i Aktiviteter-fanen.
Velg dataflyten på datasamlebåndlerretet, og velg deretter fanen Innstillinger. Velg dataflyten du opprettet tidligere fra rullegardinlisten.
Velg Lagre, og kjør for å kjøre dataflyten for å fylle ut den sammenslåtte spørringstabellen du utformet i forrige trinn.
Trinn 3: Bruke kopieringsassistenten til å legge til en kopiaktivitet
Velg Kopier data på lerretet for å åpne verktøyet Kopier hjelper for å komme i gang. Eller velg Bruk kopieringsassistent fra rullegardinlisten Kopier data under fanen Aktiviteter på båndet.
Velg datakilden ved å velge en datakildetype. I denne opplæringen bruker du Azure SQL Database som ble brukt tidligere da du opprettet dataflyten for å generere en ny flettespørring. Rull ned under eksempeldatatilbudene, og velg Azure-fanen, og deretter Azure SQL Database. Velg deretter Neste for å fortsette.
Opprett en tilkobling til datakilden ved å velge Opprett ny tilkobling. Fyll ut den nødvendige tilkoblingsinformasjonen i panelet, og skriv inn AdventureWorksLT for databasen, der vi genererte flettespørringen i dataflyten. Velg deretter Neste.
Velg tabellen du genererte i dataflyttrinnet tidligere, og velg deretter Neste.
Velg Azure Blob Storage for målet, og velg deretter Neste.
Opprett en tilkobling til målet ved å velge Opprett ny tilkobling. Angi detaljene for tilkoblingen, og velg deretter Neste.
Velg mappebane, og angi et Filnavn, og velg deretter Neste.
Velg Neste på nytt for å godta standard filformat, kolonneskilletegn, radskilletegn og komprimeringstype, eventuelt inkludert en topptekst.
Fullfør innstillingene. Deretter kan du se gjennom og velge Lagre + Kjør for å fullføre prosessen.
Trinn 5: Utforme datasamlebåndet og lagre for å kjøre og laste inn data
Hvis du vil kjøre aktiviteten Kopier etter dataflyt, drar du fra Vellykket på dataflytaktiviteten til aktiviteten Kopier. Aktiviteten Kopier kjører bare etter at dataflytaktiviteten lykkes.
Velg Lagre for å lagre datasamlebåndet. Velg deretter Kjør for å kjøre datasamlebåndet og laste inn dataene.
Planlegg kjøring av datasamlebånd
Når du er ferdig med å utvikle og teste datasamlebåndet, kan du planlegge at det skal kjøres automatisk.
Velg
Hjem i vinduet for datasamlebåndredigering.Planlegg på fanenKonfigurer tidsplanen etter behov. Eksemplet her planlegger at datasamlebåndet skal kjøre daglig klokken 20:00 frem til slutten av året.
Relatert innhold
Dette eksemplet viser deg hvordan du oppretter og konfigurerer en Dataflyt gen2 til å opprette en flettespørring og lagre den i en Azure SQL-database, og deretter kopiere data fra databasen til en tekstfil i Azure Blob Storage. Du lærte å gjøre følgende:
- Opprett en dataflyt.
- Transformer data med dataflyten.
- Opprett et datasamlebånd ved hjelp av dataflyten.
- Bestill utførelsen av trinnene i datasamlebåndet.
- Kopier data med kopieringsassistenten.
- Kjør og planlegg datasamlebåndet.
Deretter kan du gå videre for å lære mer om overvåking av datasamlebåndkjøringer.