Freigeben über


Migrieren von Azure Data Factory zu Data Factory in Microsoft Fabric

Dieser Artikel zielt auf Azure Data Factory- und Synapse Gen2-Pipelineersteller ab. Es bietet Ihnen Anleitungen und Gründe, um Ihre Pipelines zu Data Factory für Microsoft Fabric zu modernisieren und zu migrieren.

Hintergrund

Microsoft Fabric ist eine integrierte Plattform für Self-Service- und IT-verwaltete Unternehmensdaten. Mit exponentiellem Wachstum in Datenvolumen und Komplexität fordern Fabric-Kunden Unternehmenslösungen, die sicher, einfach zu verwalten und für alle Benutzer in den größten Organisationen zugänglich sind.

In den letzten Jahren investierte Microsoft erhebliche Arbeit, um skalierbare Cloudfunktionen für Kunden bereitzustellen. Zu diesem Zweck ermöglicht Data Factory in Fabric ein großes Ökosystem von Datenintegrationsentwicklern und Datenintegrationslösungen, die über Jahrzehnte aufgebaut wurden, um den vollständigen Satz von Features und Funktionen zu nutzen, die weit über vergleichbare Funktionen hinausgehen, die in früheren Generationen verfügbar sind.

Natürlich fragen Kunden, ob es eine Möglichkeit gibt, ihre Datenintegrationslösungen in Fabric zu konsolidieren. Sie stellen häufig Fragen wie:

  • Funktioniert die gesamte Funktionalität, auf die wir angewiesen sind, in Fabric-Pipelines?
  • Welche Funktionen sind nur in Fabric-Pipelines verfügbar?
  • Wie migrieren wir vorhandene Pipelines zu Fabric-Pipelines?
  • Was ist die Roadmap von Microsoft für die Erfassung von Unternehmensdaten?

Antworten auf viele dieser Fragen werden in diesem Artikel gegeben.

Hinweis

Die Entscheidung zur Migration zu Fabric-Kapazitäten hängt von den Anforderungen der einzelnen Kunden ab. Kunden sollten andere Vorteile sorgfältig auswerten, um eine fundierte Entscheidung zu treffen. Wir erwarten, dass die organische Migration zu Fabric-Pipelines im Laufe der Zeit erfolgt, und unsere Absicht ist, dass dies zu Bedingungen geschieht, mit denen jeder Kunde einverstanden ist.

Um klarzustellen, gibt es derzeit keine Pläne, Azure Data Factory oder Synapse Gen2 für die Datenaufnahme außer Betrieb zu nehmen. Es gibt eine Priorität, sich auf Fabric-Pipelines für die Erfassung von Unternehmensdaten zu konzentrieren, sodass der zusätzliche Wert, der von Fabric-Kapazitäten bereitgestellt wird, im Laufe der Zeit erhöht wird. Kunden, die Fabric-Kapazitäten auswählen, können von der Ausrichtung an die Microsoft Fabric-Produktroadmap profitieren.

Konvergenz der Integration von Unternehmens- und Self-Service-Daten

Die Konsolidierung von Elementen in Fabric vereinfacht die Ermittlung, Zusammenarbeit und Verwaltung durch die Verlagerung von Ressourcen. Auf diese Weise können zentrale IT-Teams mission-kritische Datenbewegungen und Transformationsdienste operationalisieren, die an Unternehmensstandards ausgerichtet sind, einschließlich Datenherkunft und Überwachung, und so die Integration beliebter Self-Service-Elemente erleichtern.

Um die kollaborativen und skalierbaren Anforderungen von Organisationen zu unterstützen, führen Fabric-Pipelines Office 365- und Teams-Aktivitäten zum Senden von Nachrichten, nahtlose Aktualisierungen von Power BI-Semantikmodellen und robuste Governance-Features ein, die Organisationen beim Verwalten von Datenlinien und Pipelineüberwachung unterstützen. Durch die Integration von generativen KI über Copilot wird die Pipelineerfahrung weiter verbessert, indem intelligente Erklärungen zur Pipelinegenerierung und Fehlerauflösung angeboten werden, wodurch die Erstellung und Verwaltung komplexer Lösungen vereinfacht wird.

Durch die Nutzung einer gemeinsamen Plattform wird der Workflow optimiert und die Lösungsentwicklung zwischen Unternehmen und IT verbessert. Dadurch können Organisationen ihre Datenlösungen auf Unternehmensebenen skalieren, um hohe Leistung, Flexibilität und Effizienz bei der Verwaltung großer Datenmengen sicherzustellen.

Fabric-Kapazitäten

Aufgrund der verteilten Architektur sind Fabric-Kapazitäten weniger empfindlich für die Gesamtlast, zeitliche Spitzen und hohe Parallelität. Durch die Konsolidierung der Kapazitäten auf größere Fabric-Kapazitäts-SKUs können Kunden eine höhere Leistung und einen höheren Durchsatz erzielen.

Merkmalsvergleich

In der folgenden Tabelle sind features aufgeführt, die in Azure Data Factory und Fabric Data Factory unterstützt werden.

Funktion Azure Data Factory Stoffdatenfabrik
Pipelineaktivitäten
Office 365- und Microsoft Teams Aktivitäten ermöglichen es Ihnen, Nachrichten nahtlos zu senden und damit eine effiziente Kommunikation und Zusammenarbeit in Ihrer Organisation zu fördern. Nein Ja
Stellen Sie Verbindungen mit Ihrem Power BI-Semantikmodell und Dataflow Gen2 her, um sicherzustellen, dass Ihre Daten konsistent aktualisiert werden und auf dem neuesten Stand sind. Nein Ja
Sie können mithilfe einer Prüfung in einer Pipeline sicherstellen, dass diese die Ausführung nur fortsetzt, nachdem sie überprüft hat, ob der angefügte Datasetverweis vorhanden ist und die angegebenen Kriterien erfüllt oder ob das Timeout erreicht wurde. Ja Ja1
Ausführen eines SQL Server Integration Services (SSIS)--Pakets zum Ausführen von Datenintegrations- und Transformationsvorgängen Ja Geplant
Datentransformation
Visuell gestaltete Datenumwandlungen unter Verwendung von Apache Spark-Clustern mit Mapping Dataflows, um Datenumwandlungsprozesse über eine grafische Benutzeroberfläche zu erstellen und zu verwalten. Ja Nein2
Visuell gestaltete Datenumwandlungen mithilfe der Fabric-Rechenmaschine mit der intuitiven grafischen Benutzeroberfläche von Power Query in Dataflow Gen2 Nein Ja
Konnektivität
Unterstützung für alle Data Factory-Datenquellen Ja In Bearbeitung3
Skalierbarkeit
Sicherstellen der nahtlosen Ausführung von Aktivitäten in einer Pipeline mit geplanten Ausführungen Ja Ja
Planen mehrerer Ausführungen für eine einzelne Pipeline für flexible und effiziente Pipelineverwaltung Ja Geplant
Verwenden von Triggern für rollierende Fenster zum Planen von Pipelineausführungen innerhalb von unterschiedlichen, sich nicht überlappenden Zeitfenstern Ja Geplant
Ereignistrigger zum Automatisieren der Ausführung von Pipeline-Durchläufen als Reaktion auf bestimmte oder relevante Ereignisse Ja Ja4
Künstliche Intelligenz
Copilot für Data Factory für intelligente Pipelinegenerierung zum einfachen Erfassen von Daten und Erklärungen, um komplexe Pipelines besser zu verstehen oder Vorschläge für Fehlermeldungen bereitzustellen Nein Ja
Content Management
Datenlinienansicht, die Benutzern helfen, Pipelineabhängigkeiten zu verstehen und zu bewerten Nein Ja
Bereitstellungspipelines, die den Lebenszyklus von Inhalten verwalten Nein Ja
Plattformskalierbarkeit und Resilienz
Premium-Kapazität-Architektur, die erhöhte Skalierung und Leistung unterstützt Nein Ja
Multi-Geo--Unterstützung, die multinationalen Kunden dabei hilft, regionale, branchenspezifische oder organisatorische Datenresidenzanforderungen zu erfüllen Ja Ja
Sicherheitsmaßnahmen
Virtual Network-Datengateway-Konnektivität, wodurch Fabric nahtlos im virtuellen Netzwerk einer Organisation arbeiten kann Nein Geplant
Konnektivität mit dem lokalen Datengateway, was den sicheren Zugriff auf Daten zwischen den lokalen Datenquellen einer Organisation und Fabric-Elementen ermöglicht Nein Ja
Azure -Diensttags Unterstützung. Dabei handelt es sich um eine definierte Gruppe von IP-Adressen, die automatisch verwaltet werden, um die Komplexität von Updates oder Änderungen an Netzwerksicherheitsregeln zu minimieren. Ja Ja
Governance
Inhalte Billigung, um wertvolle, hochwertige Stoffartikel zu fördern oder zu zertifizieren Nein Ja
Microsoft Purview-Integration, wodurch Kunden Fabric-Elemente verwalten und steuern können Ja Ja
Microsoft Information Protection (MIP) Vertraulichkeitsbezeichnungen und Integration mit Microsoft Defender for Cloud Apps zur Verhinderung von Datenverlust Nein Ja
Überwachungs- und Diagnoseprotokollierung
Protokollieren von Pipelineausführungsereignissen in einem Ereignisspeicher zum Überwachen, Analysieren und Beheben von Problemen mit der Pipelineleistung Ja Geplant
Überwachungszentrum, das Überwachungsfunktionen für Fabric-Elemente bereitstellt Nein Ja
Microsoft Fabric-Kapazitätsmetriken-App, die Überwachungsfunktionen für Fabric-Kapazitäten bereitstellt Nein Ja
Überwachungsprotokoll, das Benutzeraktivitäten in Fabric und Microsoft 365 nachverfolgt Nein Ja

1 Verwenden Sie die Aktivität Get metadata, Until und If condition für einen entsprechenden Metadatenabruf der Überprüfungsaktivität.

2 Verwenden Sie die Remotepipelinefunktion „Invoke“ (Aufrufen), um die Zuordnungsdatenflussaktivitäten auszuführen. Weitere Informationen finden Sie unter Invoke Pipelineaktivität.

3 Informationen zum Anzeigen der Connectors, die derzeit für Datenpipelines unterstützt werden, finden Sie unter Pipelineunterstützung.

4 Verwenden Sie Fabric-Ereignisstreams und Reflex, um Ausführungsereignisse auszulösen. Weitere Informationen finden Sie unter Pipeline-Ereignistrigger.

Überlegungen

Es gibt einige weitere Überlegungen, die Sie bei der Planung berücksichtigen müssen, bevor Sie zu Fabric-Pipelines migrieren.

Lizenzierung

Fabric-Pipelines erfordern mindestens eine Microsoft Fabric-Lizenz (Free), um in einem Arbeitsbereich mit Premium-Kapazität zu erstellen. Weitere Informationen finden Sie unter Fabric-Lizenzen.

Fahrplan

In der Dokumentation des Microsoft Fabric-Releaseplans werden den Kunden die neuesten Updates und Zeitpläne angekündigt, während neue Funktionen für zukünftige Versionen vorbereitet werden, einschließlich der neuen und geplanten Funktionen für Data Factory in Microsoft Fabric.

Weitere Informationen finden Sie in Microsoft Fabric-Versionsplandokumentation.

Erfahren Sie, wie Sie die Migration von ADF zu Fabric Data Factoryplanen.