Migrieren von Dataflow Gen1 zu Dataflow Gen2
Dieser Artikel richtet sich an Power BI-Datenflussersteller. Es bietet ihnen Anleitungen und Begründungen, um ihre Datenflüsse in Dataflow Gen2 innerhalb der Data Factory- Umgebung für Microsoft Fabric zu migrieren.
Anmerkung
Dataflow Gen2 ist eine neue Generation von Datenflüssen, die neue Features und verbesserte Funktionen bietet. Gen2-Datenflüsse befinden sich zusammen mit Power BI-Datenflüssen, die jetzt als Dataflow Gen1bezeichnet werden.
Um die Unterschiede zwischen Dataflow Gen1 und Dataflow Gen2 zu verstehen, sehen Sie unter Übergang von Dataflow Generation 1 zu Dataflow Generation 2.
Hintergrund
Microsoft Fabric wurde zu einer integrierten Plattform für Self-Service- und IT-verwaltete Unternehmensdaten entwickelt. Mit exponentiellem Wachstum in Datenvolumen und Komplexität fordern Fabric-Kunden, dass ihre Unternehmenslösungen skalieren, sicher, einfach zu verwalten und für alle Benutzer in den größten Organisationen zugänglich sind.
In den letzten Jahren hat Microsoft große Fortschritte unternommen, um skalierbare Cloudfunktionen für Fabric-Kapazitätbereitzustellen. Zu diesem Zweck ermöglicht Data Factory in Fabric sofort ein großes Ökosystem von Datenintegrationsentwicklern und Datenintegrationslösungen, die über Jahrzehnte aufgebaut wurden. Er nutzt den vollständigen Satz von Features und Funktionen, die weit über vergleichbare Funktionen hinausgehen, die in früheren Generationen verfügbar sind.
Natürlich fragen Kunden nun, ob es die Möglichkeit gibt, ihre Datenintegrationslösungen zu konsolidieren, indem sie sie in Fabric hosten. Sie stellen häufig Fragen wie:
- Funktionieren alle Datenfluss-Funktionalitäten, von denen wir abhängig sind, in Dataflow Gen2?
- Welche Funktionen sind nur in Dataflow Gen2 verfügbar?
- Wie migrieren wir vorhandene Datenflüsse zu Dataflow Gen2?
- Was ist die Roadmap von Microsoft für die Erfassung von Unternehmensdaten?
Antworten auf viele dieser Fragen werden in diesem Artikel beschrieben.
Anmerkung
Die Entscheidung für die Migration zur Fabric-Kapazität hängt von den Anforderungen der einzelnen Kunden ab. Die Kunden sollten die Vorteile sorgfältig auswerten, um eine fundierte Entscheidung zu treffen. Wir erwarten, dass die organische Migration zu Dataflow Gen2 im Laufe der Zeit erfolgt, und unsere Absicht ist, dass es zu Bedingungen geschieht, mit denen der Kunde vertraut ist.
Derzeit gibt es keine Pläne, Power BI-Datenflüsse oder Power Platform-Datenflüsse einzustellen. Jedoch liegt die Priorität darauf, in Dataflow Gen2 für die unternehmensweite Datenaufnahme zu investieren, und dadurch wird der von Fabric bereitgestellte Wert im Laufe der Zeit erhöht. Kunden, die Fabric-Kapazität auswählen, können von der Ausrichtung auf die Microsoft Fabric-Produktroadmapprofitieren.
Konvergenz der Self-Service- und Unternehmensdatenintegration
Die Konsolidierung von Elementen in Fabric vereinfacht die Ermittlung, Zusammenarbeit und Verwaltung durch das Zusammenführen von Ressourcen. Es ermöglicht zentralen IT-Teams, beliebte Self-Service-Elemente einfacher zu übernehmen und zu integrieren. Gleichzeitig ermöglicht es die Operationalisierung unternehmenskritischer Datenbewegungen und Transformationsdienste, die an Unternehmensstandards ausgerichtet sind, einschließlich Datenlinie und Überwachung.
Um die kollaborativen und skalierbaren Anforderungen von Erstellern zu unterstützen, führt Dataflow Gen2 in Fabric schnelle Kopieein, wodurch die effiziente Erfassung großer Datenvolumes mithilfe der Back-End-Infrastruktur von Fabric zum Speichern und Verarbeiten Zwischendaten während der Transformation ermöglicht wird. Es kann Terabytes von Daten nahtlos verarbeiten. Dataflow-Ersteller können Datenziele angeben, die für ihre transformierten Daten, z. B. ein Fabric Lakehouse, ein Data Warehouse, ein Eventhaus oder eine Azure SQL-Datenbank, die eine bessere Datenverwaltung und Zugänglichkeit ermöglichen. Zudem verbessert die jüngste Integration von generativer KI durch Copilot die Datenvorbereitungserfahrung, indem intelligente Codegenerierung und Automatisierung sich wiederholender Aufgaben bereitgestellt werden. Es bietet einen einfacheren und schnelleren Weg zur Erstellung komplexer Lösungen.
Durch die Nutzung einer gemeinsamen Plattform wird der Workflow optimiert, was zu einer verbesserten Zusammenarbeit zwischen dem Unternehmen und der IT führt. Organisationen sind daher in der Lage, ihre Datenlösungen auf Unternehmensebenen zu skalieren, um hohe Leistung, Flexibilität und Effizienz bei der Verwaltung großer Datenmengen sicherzustellen.
Fabric-Kapazität
Dank der verteilten Architektur ist die Fabric-Kapazität weniger anfällig für die Gesamtlast, zeitliche Belastungsspitzen und hohe Parallelität. Durch die Konsolidierung der Kapazitäten auf größere Fabric-Kapazitäts-SKUs können Kunden eine höhere Leistung und einen höheren Durchsatz erzielen.
Merkmalsvergleich
Die folgende Tabelle enthält Features, die in Power BI-Datenfluss und/oder Fabric Dataflow Gen2 unterstützt werden.
Merkmal | Power BI Dataflow Gen1 | Fabric Dataflow Gen2 |
---|---|---|
Konnektivität | ||
Unterstützung für alle Power Query-Datenquellen | Ja | Ja |
Verbindung herstellen und Daten aus Datenflüssen in Power BI Desktop, Excel oder Power Apps laden | Ja | Ja |
Skalierbarkeit | ||
schnelle Kopie, die die Erfassung großer Datenmengen unterstützt, wobei die Datenpipeline Kopieren von Aktivitäten innerhalb von Datenflüssen verwendet wird | Nein | Ja |
Geplante Aktualisierung, wodurch Daten aktuell bleiben | Ja | Ja |
Inkrementelles Refresh, das Richtlinien zur Automatisierung des inkrementellen Datenaufbaus verwendet und dabei helfen kann, Berichte nahezu in Echtzeit zu liefern | Ja | Ja |
Datenpipeline-Orchestrierung, mit der Sie einer Datenpipeline eine Datenfluss-Aktivität hinzufügen und orchestrierte bedingte Ereignisse erstellen können | Nein | Ja |
künstliche Intelligenz | ||
Copilot für Data Factory, der intelligente Codegenerierung anbietet, um Daten mühelos zu transformieren, und Codeerläuterungen generiert, um komplexe Aufgaben besser zu verstehen. | Nein | Ja |
Cognitive Services, die künstliche Intelligenz (KI) nutzen, um mittels verschiedener Algorithmen von Azure Cognitive Services die Self-Service-Datenvorbereitung anzureichern. | Ja | Keine 1 |
Automatisiertes Maschinelles Lernen (AutoML), das es Geschäftsanalysten ermöglicht, Modelle direkt in Fabric zu trainieren, zu validieren und aufzurufen. | Veraltete 2 | |
Azure Machine Learning Integration, die benutzerdefinierte Modelle als dynamische Power Query-Funktionen verfügbar macht, die Benutzer im Power Query-Editor aufrufen können | Ja | Keine 1 |
Inhaltsverwaltung | ||
Datenlinienansicht, die Benutzern helfen, Datenflusselementabhängigkeiten zu verstehen und zu bewerten | Ja | Ja |
Bereitstellungspipelines, die den Lebenszyklus von Fabric-Inhalten verwalten | Ja | Ja |
Plattform-Skalierbarkeit und Resilienz | ||
Premium-Kapazität Architektur, die erhöhte Skalierung und Leistung unterstützt | Ja | Ja |
Multi-Geo--Unterstützung, die multinationalen Kunden dabei hilft, regionale, branchenspezifische oder organisatorische Datenresidenzanforderungen zu erfüllen | Ja 3 | Ja |
Sicherheit | ||
VNet-Datengateway Konnektivität, wodurch Fabric nahtlos im virtuellen Netzwerk einer Organisation zusammenarbeiten kann | Nein | Ja |
On-Premises-Datengateway-Konnektivität, welche den sicheren Zugriff auf Daten zwischen den lokalen Datenquellen einer Organisation und Fabric ermöglicht. | Ja | Ja |
Der Azure -Dienst unterstützt Service-Tags, bei denen es sich um eine definierte Gruppe von IP-Adressen handelt, die automatisch verwaltet werden, um die Komplexität von Updates oder Änderungen an Netzwerksicherheitsregeln zu minimieren. | Ja | Ja |
Governance | ||
Inhalte Billigung, um wertvolle, hochwertige Stoffartikel zu fördern oder zu zertifizieren | Ja | Ja |
Microsoft Purview-Integration, wodurch Kunden Fabric-Elemente verwalten und steuern können | Ja | Ja |
Microsoft Information Protection (MIP) Vertraulichkeitsbezeichnungen und Integration in Microsoft Defender für Cloud Apps zur Verhinderung von Datenverlust (DLP) | Ja | Ja |
Überwachungs- und Diagnoseprotokollierung | ||
Erweiterter Aktualisierungsverlauf, mit dem Sie im Detail auswerten können, was während der Aktualisierung des Datenflusses passiert ist. | Nein | Ja |
Überwachungszentrum, das Überwachungsfunktionen für Fabric-Elemente bereitstellt | Nein | Ja |
Microsoft Fabric-Kapazitätsmetriken-App, die Überwachungsfunktionen für die Kapazität von Fabric bereitstellt | Ja | Ja |
Überwachungsprotokoll, das Benutzeraktivitäten in Fabric und Microsoft 365 nachverfolgt | Ja | Ja |
1 Informationen zum Erstellen von benutzerdefinierten Funktionen, die Azure AI-API-Endpunkte aufrufen, finden Sie unter Lernprogramm: Extrahieren von Schlüsselausdrücken aus Text, der in Power BIgespeichert ist.
2 Automated Machine Learning (AutoML) ist veraltet. Weitere Informationen finden Sie unter dieser offiziellen Ankündigung.
3 Informationen zum Konfigurieren des Power BI-Datenfluss-Speichers zur Verwendung von Azure Data Lake Storage (ADLS) Gen2 finden Sie in diesem Artikel.
Betrachtungen
Es gibt weitere Überlegungen, die Sie in Ihre Planung berücksichtigen müssen, bevor Sie zu Dataflow Gen2 migrieren.
Zulassung
Sie benötigen eine Pro- oder Premium-Lizenz für jeden Benutzer (PPU), um Power BI-Datenflüsse (Dataflow Gen1) zu veröffentlichen oder zu verwalten. Im Gegensatz dazu benötigen Sie nur eine Microsoft Fabric(Free)-Lizenz, um einen Dataflow Gen2 in einem Premium-Kapazitätsarbeitsbereich zu erstellen.
Migration
Power Query-Vorlagen vereinfachen den Prozess der Übertragung eines Projekts zwischen verschiedenen Power Query-Integrationen. Sie helfen dabei, das zu optimieren, was andernfalls eine komplexe und zeitaufwendige Aufgabe sein könnte. Vorlagen kapseln das gesamte Power Query-Projekt, einschließlich Skripts und Metadaten, in eine einzelne, portable Datei.
Power Query-Vorlagen wurden so konzipiert, dass sie mit verschiedenen Integrationen wie Power BI-Datenflüssen und Fabric Dataflow Gen2 kompatibel sind und einen reibungslosen Übergang zwischen diesen Diensten gewährleisten.
Fahrplan
Der Microsoft Fabric-Releaseplan kündigt die neuesten Updates und Zeitpläne an, da Features für die zukünftige Veröffentlichung vorbereitet sind, einschließlich der Neuerungen und geplanten Entwicklungen für die Data Factory in Microsoft Fabric.
Verwandte Inhalte
Weitere Informationen zu diesem Artikel finden Sie in den folgenden Ressourcen: