Hente inn eksporterte Dataverse-data med Azure Data Factory

Artikkel
03/15/2023

Når du har eksportert data fra Microsoft Dataverse til Azure Data Lake Storage Gen2 med Azure Synapse Link for Dataverse, kan du bruke Azure Data Factory til å opprette dataflyter, transformere dataene og kjøre analyse.

Obs!

Azure Synapse Link for Dataverse var tidligere kjent som Eksporter til datasjø. Tjenesten har fått nytt navn med virkning fra mai 2021 og vil fortsette å eksportere data til Azure Data Lake samt Azure Synapse Analytics.

Denne artikkelen viser hvordan du utfører følgende oppgaver:

Angi Data Lake Storage Gen2-lagringskontoen med Dataverse-dataene som en kilde i en Data Factory-dataflyt.
Transformerer Dataverse-dataene i Data Factory med en dataflyt.
Angi Data Lake Storage Gen2-lagringskontoen med Dataverse-dataene som en mottaker i en Data Factory-dataflyt.
Kjør dataflyten ved å opprette en pipeline.

Forutsetninger

Denne delen beskriver forhåndskravene som kreves for å hente inn eksporterte Dataverse-data med Data Factory.

Azure-roller. Brukerkontoen som brukes til å logge på Azure, må være medlem i rollen bidragsyter eller eier, eller administrator for Azure-abonnementet. Hvis du vil vise tillatelsene du har i abonnementet, går du til Azure-portalen, velger brukernavnet ditt øverst i høyre hjørne, velger ..., og velger deretter Mine tillatelser. Hvis du har tilgang til flere abonnementer, velger du det som passer. Hvis du vil opprette og administrere underordnede ressurser for Data Factory i Azure-portalen, inkludert datasett, koblede tjenester, pipelines, utløsere og integreringskjøretider, må du tilhøre rollen Data Factory-bidragsyter på ressursgruppenivå eller over.
Azure Synapse Link for Dataverse. Denne veiledningen forutsetter at du allerede har eksportert Dataverse-data ved hjelp av Azure Synapse Link for Dataverse. I dette eksemplet eksporteres kontotabelldataene til datasjøen.
Azure Data Factory. Denne veiledningen forutsetter at du allerede har opprettet en datafabrikk under samme abonnements- og ressursgruppe som lagringskontoen som inneholder de eksporterte Dataverse-dataene.

Angi Data Lake Storage Gen2-lagringskontoen som kilde

Åpne Azure Data Factory, og velg datafabrikken som finnes i samme abonnements- og ressursgruppe som lagringskontoen som inneholder de eksporterte Dataverse-dataene. Deretter velger du Opprett dataflyt på startsiden.
Aktiver modusen for dataflytfeilsøking, og velg ønsket tidspunkt for live. Dette kan ta opptil 10 minutter, men du kan fortsette med følgende trinn.
Velg Legg til kilde.
Under Kildeinnstillinger gjør du følgende:
- Navn på utdataflyt: Skriv inn navnet du vil bruke.
- Kildetype: Velg Innebygd.
- Innebygd datasett-type: Velg Common Data Model.
- Koblet tjeneste: Velg lagringskontoen fra rullegardinmenyen, og koble deretter en ny tjeneste ved å oppgi abonnementsdetaljene dine og beholde alle standardkonfigurasjoner.
- Sampling : Hvis du vil bruke alle dataene dine, velger du Deaktiver.
Under Kildealternativer gjør du følgende:
- Metadataformat: Velg Model.json.
- Rotplassering: Skriv inn beholdernavnet i den første boksen (Beholder) eller Bla gjennom for beholdernavnet, og velg OK.
- Enhet: Angi tabellnavnet eller Bla gjennom for tabellen.
Kontroller kategorien Projeksjon for å kontrollere at skjemaet er importert. Hvis du ikke ser noen kolonner, velger du Skjemaalternativer og kontrollerer alternativet for Utled driftede kolonnetyper. Konfigurer formateringsalternativene slik at de samsvarer med datasettet, og velg deretter Bruk.
Du kan vise dataene i kategorien Forhåndsvisning av data for å sikre at kildeopprettelsen ble fullstendig og nøyaktig.

Transformere Dataverse-dataene dine

Når du har angitt de eksporterte Dataverse-dataene i Azure Data Lake Storage Gen2-kontoen som en kilde i dataflyten Data Factory, er det mange muligheter for å transformere dataene. Mer informasjon: Azure Data Factory

Følg disse instruksjonene for å opprette en rangering for hver rad etter feltet omsetning for kontotabellen.

Velg + i nedre høyre hjørne av den forrige transformasjonen, og søk deretter etter og velg Rangering.
Angi følgende i kategorien Rangeringsinnstillinger:
- Navn på utdatastrøm: Angi ønsket navn, for eksempel Rangering1.
- Innkommende strøm: Velg ønsket kildenavn. I dette tilfellet kildenavnet fra forrige trinn.
- Alternativer: Ikke merk av for alternativene.
- Rangeringskolonne: Angi navnet på rangeringskolonnen som ble generert.
- Sorteringsbetingelser: Velg omsetning-kolonnen, og sorter i Synkende rekkefølge.
Du kan vise dataene i kategorien for forhåndsvisning av data, der du finner den nye revenueRank-kolonnen helt til høyre.

Sett Data Lake Storage Gen2-lagringskontoen som en mottaker

Til slutt må du angi en mottaker for dataflyten. Følg disse instruksjonene for å plassere de transformerte dataene som en tekstfil med skilletegn i datasjøen.

Velg + i nedre høyre hjørne av den forrige transformasjonen, og søk deretter etter og velg Mottaker.
I kategorien Mottaker gjør du følgende:
- Navn på utdataflyt: Skriv inn navnet du vil bruke, for eksempel Mottaker1.
- Innkommende flyt: Velg ønsket kildenavn. I dette tilfellet kildenavnet fra forrige trinn.
- Mottakertype: Velg DelimitedText.
- Koblet tjeneste: Velg beholderen for Data Lake Storage Gen2-lagring som har dataene du eksporterte ved hjelp av Azure Synapse Link for Dataverse-tjenesten.
I kategorien Innstillinger gjør du følgende:
- Mappebane: Skriv inn beholdernavnet i den første boksen (Filsystem) eller Bla gjennom for beholdernavnet, og velg OK.
- Filnavnalternativ: Velg utdata til én fil.
- Utdata til enkeltfil: Angi et filnavn, for eksempel ADFutdata
- La alle andre standardinnstillinger stå.
Sett Delingsalternativ til Enkel partisjon i kategorien Optimaliser.
Du kan vise dataene i fanen Forhåndsvisning av data.

Kjøre dataflyten

I venstre rute under fabrikkressurser velger du + og velger deretter Pipeline.
Under Aktiviteter velger du Flytt og transformer, og dra deretter Dataflyt til arbeidsområdet.
Velg Bruk eksisterende dataflyt, og velg deretter dataflyten du opprettet i de foregående trinnene.
Velg Feilsøking fra kommandolinjen.
La dataflyten kjøre til den nedre visningen angir at den er fullført. Dette kan ta noen minutter.
Gå til den endelige mållagringsbeholderen, og finn den transformerte tabelldatafilen.

Se også

Konfigurer Azure Synapse Link for Dataverse med Azure Data Lake

Analysere Dataverse-data i Azure Data Lake Storage Gen2 med Power BI

Obs!

Kan du fortelle oss om språkinnstillingene for dokumentasjonen? Ta en kort undersøkelse. (vær oppmerksom på at denne undersøkelsen er på engelsk)

Undersøkelsen tar rundt sju minutter. Det blir ikke samlet inn noen personopplysninger (personvernerklæring).

Del via