Migreren van Dataflow Gen1 naar Dataflow Gen2
Dit artikel is bedoeld voor makers van Power BI-gegevensstromen. Het biedt hen richtlijnen en logica om hun gegevensstromen te migreren naar Dataflow Gen2 in Data Factory- voor Microsoft Fabric.
Notitie
Dataflow Gen2 is een nieuwe generatie gegevensstromen die nieuwe functies en verbeterde ervaringen biedt. Gen2-gegevensstromen bevinden zich naast Power BI-gegevensstromen, die nu bekend staan als Dataflow Gen1.
Zie Getting from Dataflow Generation 1 to Dataflow Generation 2voor meer informatie over de verschillen tussen Dataflow Gen1 en Dataflow Gen2.
Achtergrond
Microsoft Fabric is uitgegroeid tot een geïntegreerd platform voor zowel selfservice- als door IT beheerde bedrijfsgegevens. Met exponentiële groei in gegevensvolumes en complexiteit eisen Fabric-klanten dat hun bedrijfsoplossingen worden geschaald, veilig, gemakkelijk te beheren en toegankelijk zijn voor alle gebruikers in de grootste organisaties.
In de afgelopen jaren heeft Microsoft grote stappen gezet om schaalbare cloudmogelijkheden te leveren aan Fabric-capaciteit. Daartoe stelt Data Factory in Fabric ontwikkelaars van gegevensintegratie en oplossingen voor gegevensintegratie in staat om onmiddellijk te profiteren van een groot ecosysteem dat gedurende tientallen jaren is opgebouwd. Het maakt gebruik van de volledige set functies en mogelijkheden die veel verder gaan dan vergelijkbare functionaliteit die beschikbaar is in vorige generaties.
Natuurlijk vragen klanten nu of er een mogelijkheid is om hun oplossingen voor gegevensintegratie te consolideren door ze in Fabric te hosten. Ze stellen vaak vragen zoals:
- Werkt alle gegevensstroomfunctionaliteiten waar we van afhankelijk zijn in Dataflow Gen2?
- Welke mogelijkheden zijn alleen beschikbaar in Dataflow Gen2?
- Hoe migreren we bestaande gegevensstromen naar Dataflow Gen2?
- Wat is de roadmap van Microsoft voor het opnemen van zakelijke gegevens?
Antwoorden op veel van deze vragen worden beschreven in dit artikel.
Notitie
De beslissing om naar Fabric-capaciteit te migreren, is afhankelijk van de vereisten van elke klant. Klanten moeten de voordelen zorgvuldig evalueren om een weloverwogen beslissing te nemen. We verwachten dat we in de loop van de tijd organische migratie naar Dataflow Gen2 zien, en onze bedoeling is dat het gebeurt op voorwaarden waarmee de klant vertrouwd is.
Om duidelijk te zijn, zijn er momenteel geen plannen om Power BI-gegevensstromen of Power Platform-gegevensstromen te verwijderen. Er is echter een prioriteit om de investeringen te focussen op Dataflow Gen2 voor de gegevensverwerking van ondernemingen, waardoor de waarde die door de Fabric capaciteit wordt geboden met de tijd toeneemt. Klanten die de Fabric-capaciteit kiezen, kunnen verwachten dat ze kunnen profiteren van de aansluiting met de Microsoft Fabric-productroadmap.
Convergentie van selfservice en zakelijke gegevensintegratie
De samenvoeging van items in Fabric vereenvoudigt ontdekking, samenwerking en beheer door resources op één plaats te brengen. Het stelt centrale IT-teams in staat om populaire selfservice-items gemakkelijker te gebruiken en te integreren. Tegelijkertijd kunnen bedrijfskritieke gegevensverplaatsings- en transformatieservices operationeel worden die zijn afgestemd op bedrijfsstandaarden, waaronder gegevensherkomst en -bewaking.
Ter ondersteuning van de gezamenlijke en schaalbare behoeften van makers introduceert Dataflow Gen2 in Fabric snel kopiëren, waardoor grote gegevensvolumes efficiënt kunnen worden opgenomen met behulp van de back-endinfrastructuur van Fabric om tussenliggende gegevens tijdens de transformatie op te slaan en te verwerken. Het kan naadloos omgaan met terabytes aan gegevens. Makers van gegevensstromen kunnen gegevensbestemmingen opgeven voor hun getransformeerde gegevens, zoals een Fabric lakehouse, warehouse, eventhouse of Azure SQL Database, waardoor beter gegevensbeheer en verhoogde toegankelijkheid worden gefaciliteerd. En wat meer is, de recente integratie van generatieve AI via Copilot verbetert de ervaring voor gegevensvoorbereiding door intelligente codegeneratie en terugkerende taken te automatiseren, waardoor een eenvoudiger en sneller pad wordt geboden om complexe oplossingen te maken.
Door gebruik te maken van een gemeenschappelijk platform, wordt de werkstroom gestroomlijnd, wat resulteert in een verbeterde samenwerking tussen het bedrijf en it. Organisaties kunnen hun gegevensoplossingen daarom schalen naar bedrijfsniveaus, waardoor hoge prestaties, flexibiliteit en efficiëntie worden gegarandeerd bij het beheren van grote hoeveelheden gegevens.
Fabriccapaciteit
Dankzij de gedistribueerde architectuur is Fabric-capaciteit minder gevoelig voor de algehele belasting, tijdelijke pieken en hoge gelijktijdigheid. Door capaciteiten samen te voegen tot grotere Fabric capaciteits-SKU's, kunnen klanten betere prestaties en hogere doorvoer behalen.
Functievergelijking
De volgende tabel bevat functies die worden ondersteund in Power BI-gegevensstroom en/of Fabric Dataflow Gen2.
Kenmerk | Power BI-gegevensstroom Gen1 | Fabric Dataflow Gen2 |
---|---|---|
Connectiviteit | ||
Ondersteuning voor alle Power Query-gegevensbronnen | Ja | Ja |
Verbinding maken met en gegevens laden vanuit, gegevensstromen in Power BI Desktop, Excel of Power Apps | Ja | Ja |
schaalbaarheid | ||
Snelle kopieer-, die ondersteuning biedt voor grootschalige gegevensopname, waarbij gebruik wordt gemaakt van de gegevenspijplijn Kopieeractiviteit binnen gegevensflows | Nee | Ja |
Geplande verversing, waardoor de gegevens actueel blijven | Ja | Ja |
incrementeel vernieuwen, dat gebruikmaakt van beleid voor het automatiseren van incrementele gegevensbelasting en kan helpen bij het leveren van bijna realtime rapportage | Ja | Ja |
gegevenspijplijnindeling, waarmee u een gegevensstroomactiviteit kunt toevoegen aan een gegevenspijplijn en ingedeelde voorwaardelijke gebeurtenissen kunt maken | Nee | Ja |
kunstmatige intelligentie | ||
Copilot voor Data Factory-, dat intelligente codegeneratie biedt om gegevens eenvoudig te transformeren en code-uitleg genereert om complexe taken beter te begrijpen | Nee | Ja |
Cognitive Services, die kunstmatige intelligentie (AI) gebruiken om algoritmen van Azure Cognitive Services toe te passen en zo de voorbereiding van selfservicegegevens te verrijken. | Ja | Geen 1 |
Automatische machine learning-(AutoML), waarmee bedrijfsanalisten machine learning-modellen (ML) rechtstreeks in Fabric kunnen trainen, valideren en aanroepen | Verouderd 2 | |
Integratie van Azure Machine Learning, waarmee aangepaste modellen worden weergegeven als dynamische Power Query-functies die gebruikers kunnen aanroepen in de Power Query-editor | Ja | Geen 1 |
inhoudsbeheer | ||
weergave van gegevensherkomst, die gebruikers helpt om afhankelijkheden van gegevensstromen te begrijpen en te beoordelen | Ja | Ja |
Implementatiepijplijnen, die de levenscyclus van Fabric-content beheert | Ja | Ja |
Platform-schaalbaarheid en -tolerantie | ||
Premium-capaciteit architectuur, die ondersteuning biedt voor verbeterde schaal en prestaties | Ja | Ja |
Multi-Geo ondersteuning, waarmee multinationale klanten tegemoetkomen aan regionale, branchespecifieke of organisatiegegevenslocatie vereisten | Ja 3 | Ja |
Security | ||
Virtueel netwerk (VNet) gegevensgateway connectiviteit, wat Fabric naadloos laat werken binnen het virtuele netwerk van een organisatie | Nee | Ja |
On-premises gegevensgateway-connectiviteit, die veilige toegang verleent tot gegevens tussen de gegevensbronnen van een organisatie en Fabric | Ja | Ja |
Azure servicetags ondersteuning. Dit is een gedefinieerde groep IP-adressen die automatisch worden beheerd om de complexiteit van updates of wijzigingen in netwerkbeveiligingsregels te minimaliseren | Ja | Ja |
Governance | ||
Inhoud goedkeuring, om waardevolle, hoogwaardige Fabric-items te promoten of te certificeren | Ja | Ja |
Microsoft Purview-integratie, waarmee klanten Fabric-items kunnen beheren en beheren | Ja | Ja |
Microsoft Information Protection (MIP) vertrouwelijkheidslabels en integratie met Microsoft Defender voor Cloud Apps voor preventie van gegevensverlies (DLP) | Ja | Ja |
logboekregistratie en diagnostische logboekregistratie | ||
Uitgebreide vernieuwingsgeschiedenis, waarmee u gedetailleerd kunt evalueren wat er is gebeurd tijdens het vernieuwen van uw gegevensstroom | Nee | Ja |
Monitoring Hub, dat bewakingsmogelijkheden biedt voor Fabric-items | Nee | Ja |
Microsoft Fabric Capacity Metrics app, die bewakingsmogelijkheden biedt voor Fabric capaciteit | Ja | Ja |
auditlogboek, waarmee gebruikersactiviteiten in Fabric en Microsoft 365 worden bijgehouden | Ja | Ja |
1 Zie Zelfstudie: Sleuteltermen extraheren uit tekst die zijn opgeslagen in Power BIvoor meer informatie over het maken van aangepaste functies die Azure AI API-eindpunten aanroepen.
2 Automated Machine Learning (AutoML) is verouderd verklaard. Zie deze officiële aankondigingvoor meer informatie.
3 Zie dit artikelals u Power BI-gegevensstroomopslag wilt configureren voor het gebruik van AdLS Gen2 (Azure Data Lake Storage).
Overwegingen
Er zijn andere overwegingen om rekening te houden met uw planning voordat u naar Dataflow Gen2 migreert.
Licentieverlening
U hebt een PPU-licentie (Pro of Premium Per User) nodig om Power BI-gegevensstromen (Dataflow Gen1) te publiceren of te beheren. Daarentegen hebt u alleen een Microsoft Fabric-licentie (gratis) nodig om een Dataflow Gen2 te maken in een Premium-capaciteitswerkruimte.
Migratiescenario's
Wanneer u uw gegevensstromen migreert, is het belangrijk om verder te denken dan het kopiëren van bestaande oplossingen. In plaats daarvan raden we u aan uw oplossingen te moderniseren door te profiteren van de nieuwste innovaties en mogelijkheden van Dataflow Gen2. Deze aanpak zorgt ervoor dat uw oplossingen de groeiende vraag van het bedrijf kunnen ondersteunen.
In het artikel migratiescenario'sworden verschillende methoden voor het upgraden, inventariseren en gebruiken van accelerators zoals Power Query-sjablonen beschreven. Deze methoden kunnen helpen om een naadloze upgrade voor uw projecten te garanderen.
Routekaart
Het Microsoft Fabric-releaseplan kondigt de meest recente updates en tijdlijnen aan als functies zijn voorbereid op toekomstige release, waaronder wat er nieuw en gepland is voor Data Factory in Microsoft Fabric.
Verwante inhoud
Raadpleeg de volgende bronnen voor meer informatie over dit artikel: