Ofte stillede spørgsmål om datafabrik i Microsoft Fabric

Denne artikel indeholder svar på ofte stillede spørgsmål om Data Factory i Microsoft Fabric.

Datafabrik i Fabric

Hvad er forskellen mellem datafabrikken og fanen Data engineering i Fabric?

Data Factory hjælper dig med at løse komplekse dataintegrations- og ETL-scenarier med dataflytnings- og datatransformationstjenester i skyen, mens datakonstruktion hjælper dig med at oprette lake house, bruge Apache Spark til at transformere og forberede dine data. Forskelle mellem de enkelte Fabric-terminologier/-oplevelser er tilgængelige under Microsoft Fabric-terminologi.

Hvordan gør jeg spore og overvåge kapaciteten af Fabric, der bruges sammen med pipelinerne?

Microsoft Fabric-kapacitetsadministratorer kan bruge Microsoft Fabric Capacity Metrics-appen , også kaldet metrikappen, til at få indblik i kapacitetsressourcer. Denne app giver administratorer mulighed for at se, hvor meget CPU-udnyttelse, behandlingstid og hukommelse der bruges af datapipelines, dataflows og andre elementer i deres Fabric-kapacitetsaktiverede arbejdsområder. Få indsigt i overbelastningsårsager, spidsbelastningstider, ressourceforbrug og nemmere identificere de mest krævende eller mest populære elementer.

Hvilken fremgangsmåde anbefales til tildeling af roller i Data Factory i Fabric?

Du kan adskille de forskellige arbejdsbelastninger mellem arbejdsområder og bruge roller som medlem og fremviser til at have et arbejdsområde til datakonstruktion, der forbereder data for et arbejdsområde, der bruges til rapport- eller AI-oplæring. Med rollen læser kan du derefter bruge data fra datateknikerarbejdsområdet.

Er det muligt at oprette forbindelse til eksisterende PE-aktiverede ressourcer (Private Endpoint) i Fabric Data Factory?

I øjeblikket tilbyder den virtuelle netværksgateway en injitiv metode til problemfri integration i dit virtuelle netværk, hvilket giver en robust vej til brug af private slutpunkter til at etablere sikre forbindelser til dine datalagre. Det er vigtigt at bemærke, at den virtuelle netværksgateway kun kan bruges til Fabric-dataflow i øjeblikket. Vores kommende initiativer omfatter dog en udvidelse af dens muligheder for at omfatte Fabric-pipelines.

Hvordan kan jeg oprette forbindelse til datakilder i det lokale miljø i Fabric Data Factory?

Udgiv opdateringer og priser

Hvor kan jeg finde månedlige opdateringer, der er tilgængelige i Fabric?

Månedlige opdateringer af Fabric er tilgængelige på Microsoft Fabric-bloggen.

Hvad er Fabric Data Factory Pricing/faktureringsmodel?

Data Factory-priser i Microsoft Fabric indeholder en omfattende vejledning i, hvordan omkostningerne beregnes for datapipelines og Dataflow Gen2. Den indeholder flere scenarier med priseksempler, der kan hjælpe dig med at forstå prismodellen bedre.

Hvor kan jeg finde flere oplysninger om kommende funktioner, der er planlagt til Data Factory i Microsoft Fabric?

Nyheder og planer for Data Factory i Microsoft Fabric giver indsigt i kommende funktioner og deres anslåede udgivelsestidslinjer i løbet af de næste par måneder.

Datapipelines

Hvor hurtigt kan jeg indtage data i Fabric Data Pipelines?

Fabric Data Factory giver dig mulighed for at udvikle pipelines, der maksimerer dataflytningsoverførselshastigheden for dit miljø. Disse pipelines udnytter fuldt ud følgende ressourcer:

  • Netværksbåndbredde mellem kilde- og destinationsdatalagre
  • Input-/outputhandlinger for kilde- eller destinationsdatalager pr. sekund (IOPS) og båndbredde Denne fulde udnyttelse betyder, at du kan beregne det samlede gennemløb ved at måle det mindste gennemløb, der er tilgængeligt med følgende ressourcer:
  • Kildedatalager
  • Destinationsdatalager
  • Netværksbåndbredde mellem kilde- og destinationsdatalagreNe I mellemtiden arbejder vi løbende på innovationer for at øge det bedst mulige gennemløb, du kan opnå. I dag kan tjenesten flytte 1-TB TPC-DI-datasæt (parketfiler) til både Fabric Lakehouse-tabellen og Data Warehouse inden for 5 minutter – flytte 1B rækker under 1 min. Bemærk, at denne ydeevne kun er en reference ved at køre ovenstående testdatasæt. Det faktiske gennemløb afhænger stadig af de faktorer, der er angivet tidligere. Derudover kan du altid gange dataoverførselshastigheden ved at køre flere kopieringsaktiviteter parallelt. F.eks. ved hjælp af ForEach-løkken.

Vil CDC-funktionen være tilgængelig i Data Factory i Fabric?

Vores aktuelle fokus omfatter aktiv udvikling af CDC-funktionalitet inden for Data Factory In Fabric. Denne kommende funktion giver dig mulighed for at flytte data på tværs af flere datakilder, der kombinerer forskellige kopimønstre, herunder masse-/batchkopimønster, trinvist/fortløbende kopimønster (CDC) og kopieringsmønster i realtid til én 5x5-oplevelse.

Dataflow Gen2

Ligner Fabric Dataflow Gen2 Power Query integreret i Azure Data Factory?

Power Query-aktiviteten i ADF deler ligheder med Dataflow Gen2, men den har ekstra funktioner, der aktiverer handlinger, f.eks. skrivning til bestemte datadestinationer osv. Denne sammenligning er mere retfærdig i forhold til Dataflow Gen1 (Power BI-dataflow eller Power Apps-dataflow). Se her for at få flere oplysninger: Forskelle mellem Dataflow Gen1 og Dataflow Gen2.

I Fabric DataFlow Gen2 støder jeg nogle gange på funktioner som DataflowsStaginglakehouse/DataflowsStagingwarehouse. Hvad er disse funktioner?

I visse brugeroplevelser kan du støde på systemartefakter, der ikke er beregnet til interaktion. Det er bedst at se bort fra disse artefakter, da de med tiden vil blive fjernet fra Hent data-oplevelser i fremtiden.

Opdateringen mislykkedes med fejlmeddelelsen "Opdateringen af dataflowet mislykkedes på grund af utilstrækkelige tilladelser til at få adgang til midlertidige artefakter". Hvad skal jeg gøre?

Denne fejlmeddelelse opstår, når den bruger, der oprettede det første dataflow i arbejdsområdet, ikke har logget på Fabric i mere end 90 dage eller har forladt organisationen. For at løse problemet skal den bruger, der er nævnt i fejlmeddelelsen, logge på Fabric. Hvis brugeren har forladt organisationen, skal du åbne en supportanmodning.

Understøttelse af ADF-/Synapse-pipelines og overførselssti

Hvad er fremtiden for Azure Data Factory (ADF) og Synapse Pipelines?

Azure Data Factory (ADF) og Azure Synapse-pipelines vedligeholder en separat PaaS-køreplan (Platform as a Service). Disse to løsninger eksisterer fortsat sammen med Fabric Data Factory, der fungerer som SaaS-tilbuddet (Software as a Service). ADF- og Synapse-pipelines understøttes fortsat fuldt ud, og der er ingen planer om udfasning. Det er vigtigt at fremhæve, at for alle kommende projekter er vores forslag at starte dem ved hjælp af Fabric Data Factory. Derudover har vi strategier, der faciliterer overgangen af ADF- og Synapse-pipelines til Fabric Data Factory, så de kan drage fordel af nye Fabric-funktioner. Du kan få mere at vide om dette her.

På grund af hullerne i funktionaliteten i Data Factory for Fabric, hvad er årsagerne til at vælge det via ADF/Synapse-pipelines?

I takt med at vi bestræber os på at bygge bro over funktionalitetshuller og inkorporere de robuste orkestrerings- og arbejdsprocesfunktioner i ADF-/Azure Synapse-pipelines i Fabric Data Factory, anerkender vi, at visse funktioner, der findes i ADF-/Synapse-pipelines, kan være vigtige for dine behov. Selvom du opfordres til at fortsætte med at bruge ADF/Synapse-pipelines, hvis disse funktioner er nødvendige, opfordrer vi dig til først at udforske dine nye muligheder for dataintegration i Fabric. Din feedback om, hvilke funktioner der er afgørende for din succes, er uvurderlig. For at lette dette arbejder vi aktivt på at introducere en ny funktionalitet, der muliggør migrering af dine eksisterende datafabrikker fra Azure til Fabric-arbejdsområder.

Er nye funktioner i Fabric Data Factory også tilgængelige i ADF/Synapse?

Vi backporterer ikke nye funktioner fra Fabric-pipelines til ADF-/Synapse-pipelines. Vi har to separate køreplaner for Fabric Data Factory og ADF/Synapse. Vi evaluerer backportanmodninger som svar på indgående feedback.

Er Fabric-datapipelines de samme som Azure Synapse-pipelines?

Hovedfunktionen i Fabric-pipelinen ligner Azure Synapse-pipelinen, men ved hjælp af Fabric-pipelinen kan brugerne anvende alle dataanalysefunktionerne på Fabric-platformen. Du kan finde bemærkelsesværdige forskelle og funktionstilknytninger mellem Fabric-pipelinen og Azure Synapse-pipelinen her: Forskelle mellem Data Factory i Fabric og Azure.

Hvordan gør jeg migrere eksisterende pipelines fra Azure Data Factory (eller) Azure Synapse-arbejdsområdet til Fabric Data Factory?

For at lette kundernes overgang til Microsoft Fabric fra Azure Data Factory (ADF) tilbyder vi en række vigtige funktioner og supportmekanismer. For det første yder vi omfattende support til de fleste aktiviteter, der bruges i ADF i Fabric, sammen med tilføjelsen af nye aktiviteter, der er skræddersyet til meddelelser, f.eks. Teams- og Outlook-funktioner. Kunderne kan få adgang til en detaljeret liste over tilgængelige aktiviteter i Data Factory i Fabric. Derudover introducerede vi Fabric Lakehouse/Warehouse-connectors i Azure Data Factory, hvilket muliggør problemfri dataintegration i Fabric's OneLake-miljø for ADF-kunder. Vi leverer også en vejledning til ADF-kunder , som hjælper med at knytte dine eksisterende transformationer af dataflow til nye Dataflow Gen2-transformationer. I takt med at vi ser fremad, inkluderer vi muligheden for at montere ADF-ressourcer i Fabric i vores roadmap, hvilket giver kunderne mulighed for at bevare funktionaliteten af deres eksisterende ADF-pipelines på Azure, samtidig med at de udforsker Fabric og planlægger omfattende opgraderingsstrategier. Vi arbejder tæt sammen med kunder og community'et for at finde de mest effektive måder at understøtte migrering af datapipelines fra ADF til Fabric på. Som en del af denne indsats giver vi dig en opgraderingsoplevelse, der giver dig mulighed for at teste dine aktuelle datapipelines i Fabric gennem processen med at montere og opgradere dem.