Overføre fra Dataflyt Gen1 til Dataflyt Gen2: Overføringsscenarioer
Denne artikkelen presenterer ulike overføringsscenarioer du kan vurdere når overføring fra dataflyt gen1 til dataflyt gen2. Det gir deg også veiledning og utførelsesanbefalinger. Disse scenariene kan inspirere deg til å bestemme riktig overføringstilnærming basert på forretningskravene og -omstendighetene.
Når du overfører dataflytene, er det viktig å tenke utover bare å kopiere eksisterende løsninger. I stedet anbefaler vi at du moderniserer løsningene dine ved å dra nytte av de nyeste innovasjonene og funksjonene i Dataflow Gen2. Denne fremgangsmåten sikrer at løsningene dine kan støtte de økende kravene til virksomheten.
Dataflyt gen2 har for eksempel en funksjon som heter rask kopi, noe som reduserer tiden som kreves for å innta data for visse transformasjoner og koblinger. Dataflyt gen2 har også forbedret trinnvis oppdatering, som optimaliserer dataoppdateringsprosesser ved bare å oppdatere data som er endret. Disse fremskrittene forbedrer ikke bare ytelsen og effektiviteten, men sikrer også at løsningene skaleres.
Notat
Overføringsscenarioene er representative for reelle kundeoverføringer, men individuelle kundescenarioer vil selvfølgelig variere.
Denne artikkelen dekker ikke prisinformasjon. Hvis du vil ha prisinformasjon, kan du se Stoffpriser.
Viktig
CPU-forbruk etter dataflyt gen1 og dataflyt gen2 kan variere av mange grunner, for eksempel bruk av nye funksjoner i Dataflyt Gen2, inkludert lakehouse oppsamling og lager databehandling. Vi anbefalte at du utfører grundig analyse – kanskje som et konseptbevis (POC)– for å kvantifisere komparativt CPU-forbruk på tvers av Dataflyt Gen1 og Dataflyt Gen2 før du overfører dataflytene.
Overføringsscenarioer
Dataflyter tilbyr en allsidig plattform for å opprette skalerbare ETL-løsninger (Extract, Transform og Load) og ELT (Extract, Load, and Transform), catering til en rekke bruksscenarioer fra personlig BI- til enterprise BI.
Her er tre mulige overføringsscenarioer som har inspirert denne artikkelen:
- Personlig eller gruppebruk: Små team eller enkeltpersoner bruker dataflyter til å automatisere datainntaks- og forberedelsesoppgaver, slik at de kan fokusere på dataanalyse og innsikt. Et team kan for eksempel bruke dataflyter til å trekke ut data fra ulike kilder som Microsoft Excel eller Microsoft SharePoint. Deres dataflyter transformerer kildedata i henhold til deres spesifikke behov, og laster dem inn i en semantisk modell for rapporteringsformål.
- avdelingsbruk: Avdelinger i en organisasjon bruker dataflyter til å administrere større datakilder og komplekse transformasjoner. De kan opprette komposterbare dataflyter som fremmer gjenbruk og konsekvens på tvers av avdelingsrapporter, slik at alle gruppemedlemmer arbeider med samme versjon av data.
- Enterprise-bruk: På bedriftsnivå er dataflyter medvirkende til å innta store mengder data på tvers av flere avdelinger i stor skala. De fungerer som et sentralisert dataforberedelseslag som strømmer inn i mange semantiske modeller, som underbygger et bredt spekter av forretningsintelligens- og analyseprogrammer. Hele organisasjonen drar nytte av pålitelige, up-to-date-data, noe som muliggjør informerte beslutninger på alle nivåer.
I hvert av disse scenarioene bidrar dataflyter til å opprette robuste og skalerbare ETL/ELT-løsninger som kan vokse med behovene til teamet, avdelingen eller organisasjonen. Velutformede dataflyter sikrer at databehandlingsprosesser forblir effektive og effektive.
Hvis du vil ha mer informasjon om bruksscenarioer, kan du se Microsoft Fabric-implementeringsplanlegging.
Overføringsscenario 1
I dette overføringsscenarioet bruker organisasjonen Power BI-dataflyter for selvbetjent dataforberedelse for å støtte personlige eller teambruksscenarioer. Dataflytene finnes i ett enkelt arbeidsområde som er tilordnet en Fabric-kapasitet.
Oppretterne av dataflyten vil dra nytte av de avanserte funksjonene i Dataflyt gen2 for redigeringsformål. Samtidig planlegger de å fortsette å bruke dataflyttabeller midlertidig som datakilde under en faset overføring. Denne fremgangsmåten sikrer brukervennlighet og tilkobling for innholdsopprettere som arbeider med eksisterende semantiske Modeller for Power BI, Excel-regneark eller dataverse tabeller – i hvert fall til overgangen til støttede datakilder er fullført.
Hvis du vil overføre løsningene deres, oppretter dataflyten:
- Oppdater arbeidsområde-ID-en hvis det opprettes et nytt arbeidsområde for å lagre den nye dataflyten.
- Oppdater eksisterende løsninger fra den opprinnelige (Gen1) dataflyt-ID-en til den nye (Gen2) dataflyt-ID-en.
Her er en eksempelspørring som er oppdatert for å hente data for en datodimensjonstabell.
let
Source = PowerPlatform.Dataflows(null),
Workspaces = Source{[Id="Workspaces"]}[Data],
Workspace = Workspaces{[workspaceId="<enter new workspace ID>"]}[Data],
DataflowId = Workspace{[dataflowId="<enter new dataflow ID"]}[Data],
DimDateTable = DataflowId{[entity="DimDate", version=""]}[Data]
in
DimDateTable
Tips
Hvis du parameteriserer verdiene workspaceId
og dataflowId
i semantiske modeller, kan du bruke Datasett - Oppdateringsparameter i gruppe REST-API-operasjon for å oppdatere parameterdetaljene programmatisk.
Viktig
Selv om det er mulig å hente data ved hjelp av dataflytkoblingen, anbefales ikke denne fremgangsmåten når du bruker Dataflyt gen2. I stedet anbefaler vi at du bruker datamålfunksjonaliteten til å sende alle opprettede tabeller fra Dataflyt gen2 til Stoffelementer eller andre mål, når det er mulig. Det er fordi dataflytkoblingen bruker et underliggende lagringslag for systemimplementering (kalt DataflowsStagingLakehouse), og det kan endres når nye funksjoner eller funksjoner legges til.
Overføringsscenario 2
I dette overføringsscenarioet bruker organisasjonen Power BI-dataflyter for selvbetjent dataforberedelse for å støtte scenarioer for avdelingsbruk med komponerbare dataflyter og koblede tabeller på tvers av flere arbeidsområder.
Dataflytoppretterne ønsker å dra nytte av de avanserte egenskapene til Dataflow Gen2 for redigering, samtidig som de effektivt deler og sender dataflyttabellene til et Fabric Lakehouse. Denne metoden drar nytte av OneLake-snarveier. OneLake-snarveier forenkler løsningsbehandling ved å redusere prosessens ventetid som tradisjonelt er knyttet til koblede tabeller på tvers av arbeidsområder, og ved å eliminere overflødige datakopier.
Hvis du vil overføre løsningene deres, oppretter dataflyten:
- Erstatt koblede tabeller med OneLake-snarveier, som gir nedstrøms forbrukere direkte tilgang til dataene.
- Oppdater eksisterende løsninger og overgangsspørringer ved å erstatte funksjonene
PowerPlatform.Dataflows
ellerPowerBI.Dataflows
medLakehouse.Contents
datatilgangsfunksjonen i Fabric.
Her er et eksempel på PowerQuery-spørring som er oppdatert for å hente data fra kundedimensjonstabellen.
let
Source = Lakehouse.Contents([]),
WorkspaceId = Source{[workspaceId="<0000aaaa-11bb-cccc-dd22-eeeeee333333>"]}[Data],
LakehouseId = WorkspaceId{[lakehouseId="1111bbbb-22cc-dddd-ee33-ffffff444444"]}[Data],
DimCustomerTable = LakehouseId{[Id="DimCustomer", ItemKind="Table"]}[Data]
in
DimCustomerTable
Notat
Du kan redigere spørringsuttrykk programmatisk i en semantisk Power BI-modell publisert til Fabric ved hjelp av XMLA-endepunktet, og ved å oppdatere tabellens partisjonerte M-uttrykk.
Vær imidlertid oppmerksom på at når du endrer den semantiske modellen ved hjelp av XMLA-endepunktet, vil du aldri kunne laste den ned fra Power BI-tjenesten.
Overføringsscenario 3
I dette overføringsscenarioet bruker organisasjonen Power BI-dataflyter for selvbetjent dataforberedelse for å støtte scenarioer for avdelingsbruk med komposterbare dataflyter på tvers av flere arbeidsområder.
Oppretterne av dataflyten ønsker å dra nytte av de avanserte funksjonene i Dataflyt gen2 for redigering, samtidig som de sender ut og deler dataflyttabeller fra et Fabric-lager som har detaljerte brukertillatelser. Denne fremgangsmåten gir fleksibilitet, og datatilgang kan implementeres med sikkerhet på radnivå (RLS), sikkerhet på kolonnenivå (CLS)og dynamisk datamaskering (DDM).
Hvis du vil overføre løsningene deres, oppretter dataflyten:
- Gi datatilgang gjennom SQL-databehandlingsmotorens detaljerte tillatelser, som gir mer selektiv tilgang til bestemte brukere ved å begrense tilgangen til bestemte tabeller og skjemaer, samt implementere RLS og CLS.
- Oppdater eksisterende løsninger og overgangsspørringer ved å erstatte
PowerPlatform.Dataflows
- ellerPowerBI.Dataflows
-funksjonen medFabric.Warehouse
datatilgangsfunksjonen i Fabric.
Her er et eksempel på PowerQuery-spørring som er oppdatert for å hente data fra kundedimensjonstabellen.
let
Source = Fabric.Warehouse([]),
WorkspaceId = Source{[workspaceId="0000aaaa-11bb-cccc-dd22-eeeeee333333"]}[Data],
WarehouseId = WorkspaceId{[warehouseId="1111bbbb-22cc-dddd-ee33-ffffff444444"]}[Data],
DimCustomerTable = WarehouseId{[Schema="dbo", Item="DimCustomer"]}[Data]
in
DimCustomerTable
Overføringsveiledning
Vi anbefaler at du kompilerer en oversikt over dataflyter og avhengige elementer. Vi anbefaler også at du vurderer å bruke Power Query-maler.
Inventarliste
For å hjelpe deg med å planlegge overføringen, er det første trinnet å ta oversikt over dataflytene og alle nedstrømsløsninger som avhenger av dem. Identifisering av avhengige elementer kan bidra til å unngå nedetid og forstyrrelser.
-
dataflyter som en kilde i Power BI-
- Bruk Dataflyter – Hent oppstrøms dataflyter i gruppe REST-API-operasjon for å identifisere avstamming og avhengigheter mellom en dataflyt som bruker koblede tabeller. Koblede tabeller kan ha en dybde på opptil 32 referanser.
- Alternativt kan du bruke Semantic Link Labs
list_upstream_dataflows
-funksjonen for å forenkle prosessen med rekursivt å kalleGet Upstream Dataflows In Group
REST API-operasjonen. Funksjonen itererer over alle koblede dataflyter til den støter på en post med en tom verdi, som angir slutten av kjeden.
- Alternativt kan du bruke Semantic Link Labs
- Bruk Admin – Datasett GetDatasetToDataflowsLinksInGroupAsAdmin REST API-operasjon for å kompilere en oversikt over semantiske Power BI-modeller som bruker dataflyter i et arbeidsområde som krever oppdateringer.
- Bruk Microsoft Fabric-skanner-API-er til å hente uttrykk for mashup-spørring fra semantiske modeller i leieren. Deretter kan du søke i uttrykkene etter eventuelle dataflyt-ID-er for å forstå den fullstendige avstammingen på tvers av leieren.
- Bruk Dataflyter – Hent oppstrøms dataflyter i gruppe REST-API-operasjon for å identifisere avstamming og avhengigheter mellom en dataflyt som bruker koblede tabeller. Koblede tabeller kan ha en dybde på opptil 32 referanser.
-
dataflyter som en kilde i Power Apps
- Access-uttrykk for mashup-spørringer fra Dataflyt-tabellen i appløsningen Power Platform-dataflyter. Deretter kan du søke i uttrykkene etter eventuelle dataflyt-ID-er for å forstå den fullstendige avstammingen på tvers av programmer i leieren. Hvis du vil lære hvordan du installerer og administrerer apper i Dynamics 365 som kjører på Microsoft Dataverse, kan du se Administrere Power Apps.
-
dataflyter som en kilde i Excel
- Selv om Excel-arbeidsbøker ikke har en REST-API for å spore avstamming og avhengigheter, kan du bruke Visual Basic for Applications (VBA) og WorkbookConnection-objektet for å avgjøre om tilkoblingsstrengen inneholder teksten
Provider=Microsoft.Mashup.OleDb.1
, som angir en Power Query-tilkobling. I tillegg kan du bruke egenskapen WorkbookQuery.Formula til å trekke ut Power Query-formler. - Når du har sporet avstammingen av dataflytene, anbefaler vi at du oppdaterer eksisterende dataflyttilkoblinger i Excel for Fabric-elementer på følgende måte:
- Hvis du vil ha tilgang til SQL Analytics-endepunktet for en Fabric Lakehouse-, warehouse- eller SQL-database, bruker du SQL Server-kobling, som bruker
Sql.Database
datatilgangsfunksjonen. - Bruk Azure Data Lake Gen2 Storage-koblingen, som bruker
AzureStorage.DataLake
datatilgangsfunksjon for å få tilgang til fabric lakehouse-filinnhold. - Hvis du vil ha tilgang til en Fabric-hendelseshusdatabase, bruker du Azure Data Explorer-kobling, som bruker
AzureDataExplorer.Contents
datatilgangsfunksjon.
- Hvis du vil ha tilgang til SQL Analytics-endepunktet for en Fabric Lakehouse-, warehouse- eller SQL-database, bruker du SQL Server-kobling, som bruker
- Selv om Excel-arbeidsbøker ikke har en REST-API for å spore avstamming og avhengigheter, kan du bruke Visual Basic for Applications (VBA) og WorkbookConnection-objektet for å avgjøre om tilkoblingsstrengen inneholder teksten
Power Query-maler
Power Query-maler forenkle prosessen med å overføre et prosjekt mellom ulike Power Query-integrasjoner. De bidrar til å effektivisere det som ellers kan være en kompleks og tidkrevende oppgave. Maler omslutter hele Power Query-prosjektet, inkludert skript og metadata, i én enkelt, bærbar fil.
Power Query-maler er utformet for å være kompatible med ulike integrasjoner, for eksempel Power BI-dataflyter (Gen1) og Fabric-dataflyter (Gen2), noe som sikrer en jevn overgang mellom disse tjenestene.
Relatert innhold
Hvis du vil ha mer informasjon om denne artikkelen, kan du se følgende ressurser:
- overføre fra dataflyt gen1 til dataflyt gen2
- Stoff priser
- Spørsmål? Prøv å spørre Fabric-fellesskapet
- Forslag? Bidra med ideer for å forbedre Fabric
Stoffpartnere er tilgjengelige for å hjelpe organisasjonen med å lykkes med overføringsprosessen. Hvis du vil engasjere en Fabric-partner, kan du gå til partnerportalen