Freigeben über


Übersicht der Change Data Capture-Ressource

GILT FÜR: Azure Data Factory Azure Synapse Analytics

Tipp

Testen Sie Data Factory in Microsoft Fabric, eine All-in-One-Analyselösung für Unternehmen. Microsoft Fabric deckt alle Aufgaben ab, von der Datenverschiebung bis hin zu Data Science, Echtzeitanalysen, Business Intelligence und Berichterstellung. Erfahren Sie, wie Sie kostenlos eine neue Testversion starten!

Die Anpassung an die Cloud-First-Big Data-World kann für Datentechniker, die für den Aufbau komplexer Datenintegrations- und ETL-Pipelines verantwortlich sind, eine große Herausforderung darstellen.

Azure Data Factory führt einen neuen Mechanismus ein, um die Arbeit eines Datentechnikers zu vereinfachen.

Durch die automatische Erkennung von Datenänderungen an der Quelle, ohne dass ein komplexer Entwurf oder eine komplexe Programmierung erforderlich ist, macht ADF die Skalierung dieser Prozesse ganz einfach. Change Data Capture wird jetzt als neue native Ressource der obersten Ebene im Azure Data Factory-Studio vorhanden sein, in der Datentechniker schnell fortlaufend ausgeführte Aufträge konfigurieren können, um Big Data im großen Stil mit äußerster Effizienz zu verarbeiten.

Die neue CDC-Ressource in ADF ermöglicht eine vollständige Genauigkeit der Change Data Capture, die nahezu in Echtzeit über eine geführte Konfigurationsumgebung kontinuierlich ausgeführt wird.

Screenshot: Neue Ressource der obersten Ebene im Bereich „Factory-Ressourcen“.

Hinweis

Die Change Data Capture-Ressource in Azure Data Factory befindet sich derzeit in der Public Preview.

Unterstützte Datenquellen

  • Avro
  • Azure Cosmos DB (SQL-API)
  • Azure SQL-Datenbank
  • Verwaltete Azure SQL-Instanz
  • Durch Trennzeichen getrennter Text
  • JSON
  • ORC
  • Parquet
  • SQL Server
  • XML
  • Snowflake

Unterstützte Ziele

  • Avro
  • Azure SQL-Datenbank
  • Verwaltete SQL-Instanz
  • Durch Trennzeichen getrennter Text
  • Delta
  • JSON
  • ORC
  • Parquet
  • Azure Synapse Analytics

Bekannte Einschränkungen

  • Derzeit darf beim Erstellen von Quell-/Zielzuordnungen jede Quelle und jedes Ziel nur einmal verwendet werden.
  • Komplexe Typen werden derzeit nicht unterstützt.
  • Die selbstgehostete Integration Runtime (SHIR) wird derzeit nicht unterstützt.

Weitere Informationen zu bekannten Einschränkungen und Unterstützung bei der Problembehandlung finden Sie in diesem Leitfaden zur Problembehandlung.

Azure Synapse Analytics als Ziel

Wenn Azure Synapse Analytics als Ziel verwendet wird, stehen auf der Hauptcanvas der Tabelle Stagingeinstellungen zur Verfügung. Das Aktivieren von Staging ist obligatorisch, wenn Sie Azure Synapse Analytics als Ziel auswählen. Dadurch wird die Schreibleistung erheblich verbessert, indem eine leistungsfähige Funktion für das Massenladen wie beispielsweise der Befehl COPY INTO verwendet wird. Stagingeinstellungen können auf zwei Arten konfiguriert werden: mit Factoryeinstellungen oder als benutzerdefinierte Einstellungen. Factoryeinstellungen gelten auf Ebene der Factory. Wenn diese Einstellungen nicht konfiguriert sind, werden Sie bei der ersten Verwendung zum Abschnitt mit globalen Stagingeinstellungen weitergeleitet, um die Einstellungen zu konfigurieren. Nachdem Sie die Einstellungen konfiguriert haben, übernehmen alle CDC-Ressourcen der obersten Ebene diese Konfiguration. Benutzerdefinierte Einstellungen gelten nur für die CDC-Ressource, für die sie konfiguriert sind, und setzen die Factoryeinstellungen außer Kraft.

Hinweis

Da wir den Befehl COPY INTO verwenden, um Daten vom Stagingspeicherort an Azure Synapse Analytics zu übertragen, ist es ratsam, sicherzustellen, dass alle erforderlichen Berechtigungen in Azure Synapse Analytics vorkonfiguriert sind.

Hinweis

Beim Starten eines CDC verwenden wir immer die zuletzt veröffentlichte Konfiguration. Für die Ausführung von CDCs werden Ihnen während der Verarbeitung Ihrer Daten 4 V-Kerne universelle Datenflüsse in Rechnung gestellt.