Migrera från Dataflow Gen1 till Dataflow Gen2
Den här artikeln riktar sig till Power BI-dataflödesskapare. Det ger dem vägledning och motivering för att migrera sina dataflöden till Dataflow Gen2 i Data Factory för Microsoft Fabric.
Obs
Dataflöde Gen2 är en ny generation dataflöden som levererar nya funktioner och förbättrade upplevelser. Gen2-dataflöden finns tillsammans med Power BI-dataflöden, som nu kallas Dataflow Gen1.
Information om skillnaderna mellan Dataflöde Gen1 och Dataflöde Gen2 finns i Att förstå övergången från Dataflöde Gen1 till Dataflöde Gen2.
Bakgrund
Microsoft Fabric har utvecklats till en integrerad plattform för både självbetjäning och IT-hanterade företagsdata. Med exponentiell tillväxt i datavolymer och komplexitet kräver Fabric-kunder att deras företagslösningar skalar, är säkra, enkla att hantera och tillgängliga för alla användare i de största organisationerna.
Under de senaste åren har Microsoft tagit stora steg för att leverera skalbara molnfunktioner till Fabric-kapacitet. För detta ändamål ger Data Factory i Fabric omedelbart stöd åt ett omfattande ekosystem av dataintegreringsutvecklare och dataintegreringslösningar som har byggts upp under årtionden. Den utnyttjar den fullständiga uppsättningen funktioner och funktioner som går långt utöver jämförbara funktioner som är tillgängliga i tidigare generationer.
Naturligtvis frågar kunderna nu om det finns en möjlighet att konsolidera sina dataintegreringslösningar genom att vara värdar för dem i Fabric. De ställer ofta frågor som:
- Fungerar alla dataflödesfunktioner som vi är beroende av i Dataflöde Gen2?
- Vilka funktioner är endast tillgängliga i Dataflöde Gen2?
- Hur migrerar vi befintliga dataflöden till Dataflöde Gen2?
- Vad är Microsofts översikt över datainmatning för företag?
Svar på många av dessa frågor beskrivs i den här artikeln.
Obs
Beslutet att migrera till Fabric kapacitet beror på kraven hos varje kund. Kunderna bör noggrant utvärdera fördelarna för att fatta ett välgrundat beslut. Vi förväntar oss att se organisk migrering till Dataflow Gen2 över tid, och vår avsikt är att det sker på villkor som kunden är bekväm med.
För att vara tydlig finns det för närvarande inga planer på att avveckla Power BI-dataflöden eller Power Platform-dataflöden. Det finns dock en prioritet att fokusera investeringar på Dataflow Gen2 för inmatning av företagsdata, och värdet som tillhandahålls av Fabric-kapacitet kommer därför att öka över tid. Kunder som väljer Fabric-kapacitet kan förvänta sig att dra nytta av att vara i linje med Microsoft Fabric-produktöversikten.
Konvergens mellan självbetjäning och integrering av företagsdata
Konsolideringen av objekt i Fabric förenklar identifiering, samarbete och hantering genom att samlokalisera resurser. Det gör det enklare för centrala IT-team att införa och integrera populära självbetjäningsobjekt. Samtidigt möjliggör den operationalisering av verksamhetskritiska dataflytt- och transformeringstjänster i enlighet med företagets standarder, inklusive dataursprung och övervakning.
För att stödja skaparnas samarbets- och skalbarhetsbehov introducerar Dataflow Gen2 i Fabric snabb kopiering, vilket möjliggör effektiv inmatning av stora datavolymer genom att använda Fabric:s backend-infrastruktur för att lagra och bearbeta mellanliggande data under transformeringen. Den kan hantera terabyte med data sömlöst. Dataflödesskapare kan ange datamål för sina transformerade data, till exempel fabric lakehouse, lager, eventhouse eller Azure SQL Database, vilket underlättar bättre datahantering och tillgänglighet. Dessutom förbättrar den senaste integreringen av generativ AI via Copilot dataförberedelseupplevelsen genom att tillhandahålla intelligent kodgenerering och automatisera repetitiva uppgifter, vilket ger en enklare och snabbare väg för att skapa komplexa lösningar.
Genom att använda en gemensam plattform effektiviseras arbetsflödet, vilket resulterar i förbättrat samarbete mellan verksamheten och IT. Organisationer har därför möjlighet att skala sina datalösningar till företagsnivåer, vilket säkerställer hög prestanda, flexibilitet och effektivitet i hanteringen av stora mängder data.
Tygets kapacitet
Tack vare sin distribuerade arkitektur är Fabric-kapacitet mindre känslig för total belastning, tidstoppar och hög samtidighet. Genom att konsolidera kapaciteter till större SKU:er för tygkapacitet kan kunderna uppnå bättre prestanda och dataflöde.
Jämförelse av funktioner
I följande tabell visas funktioner som stöds i Power BI-dataflödet och/eller Fabric Dataflow Gen2.
Funktion | Power BI Dataflow Gen1 | Infrastrukturdataflöde Gen2 |
---|---|---|
Anslutning | ||
Stöd för alla Power Query-datakällor | Ja | Ja |
Ansluta till och läsa in data från dataflöden i Power BI Desktop, Excel eller Power Apps | Ja | Ja |
Skalbarhet | ||
Snabbkopiering, som stöder storskalig datainmatning, med hjälp av datapipelinen Kopieringsaktivitet i dataflöden | Nej | Ja |
schemalagd uppdatering, som håller data aktuella | Ja | Ja |
Inkrementell uppdatering, som använder principer för att automatisera inkrementell datainläsning och kan hjälpa till att tillhandahålla rapportering i nära realtid | Ja | Ja |
datapipeline-orkestrering, som låter dig lägga till en dataflödesaktivitet till en datapipeline och skapa orkestrerade villkorshändelser. | Nej | Ja |
Artificiell intelligens | ||
Copilot för Data Factory, som ger intelligent kodgenerering för att enkelt transformera data och genererar kodförklaringar för att bättre förstå komplexa uppgifter | Nej | Ja |
Cognitive Services, som använder artificiell intelligens (AI) för att tillämpa olika algoritmer från Azure Cognitive Services för att berika förberedelse av självbetjäningsdata | Ja | Ingen 1 |
Automatisk maskininlärning (AutoML), som gör det möjligt för affärsanalytiker att träna, validera och anropa maskininlärningsmodeller direkt i Fabric | Inaktuell 2 | |
Azure Machine Learning integrering, som exponerar anpassade modeller som dynamiska Power Query-funktioner som användare kan anropa i Power Query-redigeraren | Ja | Ingen 1 |
Innehållshantering | ||
Data härstamningsvy, som hjälper användare att förstå och utvärdera beroenden för dataflödesobjekt | Ja | Ja |
Implementeringspipelines, som hanterar livscykeln för Fabric-innehåll | Ja | Ja |
Plattformsskalbarhet och återhämtning | ||
Premium-kapacitet arkitektur, som stöder ökad skalning och prestanda | Ja | Ja |
Stöd för Multi-Geo- som hjälper multinationella kunder att hantera regionala, branschspecifika eller organisatoriska krav på datahemvist | Ja 3 | Ja |
Säkerhet | ||
Anslutning för virtuell nätverksdatagateway (VNet), vilket möjliggör att Fabric kan fungera sömlöst i en organisations virtuella nätverk | Nej | Ja |
lokal datagateway-anslutning, vilket möjliggör säker åtkomst av data mellan en organisations lokala datakällor och Fabric | Ja | Ja |
Azure -tjänsttaggars stöd, vilket är en definierad grupp med IP-adresser som hanteras automatiskt för att minska komplexiteten i att uppdatera eller ändra nätverkssäkerhetsregler. | Ja | Ja |
Styrning | ||
Innehåll godkännande, för att marknadsföra eller certifiera värdefulla textilartiklar av hög kvalitet | Ja | Ja |
Microsoft Purview-integrering, som hjälper kunder att hantera och styra fabric-objekt | Ja | Ja |
Microsoft Information Protection (MIP) känslighetsetiketter och integrering med Microsoft Defender för Cloud Apps för dataförlustskydd (DLP) | Ja | Ja |
Övervakning och diagnostikloggning | ||
Förbättrad uppdateringshistorik, vilket gör att du kan utvärdera i detalj vad som hände under uppdateringen av ditt dataflöde | Nej | Ja |
Övervakningshub, som tillhandahåller övervakningsfunktioner för Fabric-objekt | Nej | Ja |
Microsoft Fabric Capacity Metrics-appen, som tillhandahåller övervakningsfunktioner för Fabric-kapacitet | Ja | Ja |
Granskningslogg, som spårar användaraktiviteter i Fabric och Microsoft 365 | Ja | Ja |
1 Mer information om hur du skapar anpassade funktioner som anropar Azure AI API-slutpunkter finns i Självstudie: Extrahera nyckelfraser från text som lagras i Power BI.
2 Automated Machine Learning (AutoML) har upphört att användas. För mer information, se det här officiella meddelandet.
3 Information om hur du konfigurerar Power BI-dataflödeslagring för användning av Azure Data Lake Storage (ADLS) Gen2 finns i den här artikeln.
Överväganden
Det finns andra saker att tänka på när du planerar innan du migrerar till Dataflow Gen2.
Licensiering
Du behöver en PPU-licens (Pro eller Premium per användare) för att publicera eller hantera Power BI-dataflöden (Dataflow Gen1). Däremot behöver du bara en Licens för Microsoft Fabric (kostnadsfri) för att skapa en Dataflow Gen2 på en Arbetsyta för Premium-kapacitet.
Migreringsscenarier
När du migrerar dina dataflöden är det viktigt att tänka bortom att bara kopiera befintliga lösningar. I stället rekommenderar vi att du moderniserar dina lösningar genom att dra nytta av de senaste innovationerna och funktionerna i Dataflow Gen2. Den här metoden säkerställer att dina lösningar kan stödja de växande kraven i verksamheten.
I artikeln migreringsscenarierbeskrivs flera metoder för att uppgradera, inventera och använda acceleratorer som Power Query-mallar. Dessa metoder kan bidra till att säkerställa en smidig uppgradering för dina projekt.
Översikt
Microsoft Fabric-lanseringsplanen meddelar de senaste uppdateringarna och tidslinjerna när funktioner förbereds för framtida lansering, inklusive vad som är nytt och planerat för Data Factory i Microsoft Fabric.
Relaterat innehåll
Mer information om den här artikeln finns i följande resurser: