Szenarios für die Verwendung von Azure Data Factory

Abgeschlossen

In dieser Lerneinheit wird erläutert, wie Sie feststellen können, ob Azure Data Factory eine geeignete Datenintegrationslösung für Ihre Organisation ist. Azure Data Factory wird anhand der folgenden Kriterien beurteilt:

  • Datenintegrationsanforderungen
  • Programmierressourcen
  • Unterstützung für mehrere Datenquellen
  • Serverlose Infrastruktur

Entscheidungskriterien

Bestimmen Sie mithilfe der in der folgenden Tabelle beschriebenen Kriterien, ob Azure Data Factory verwendet werden soll.

Kriterien Analyse
Benötigen Sie überhaupt Datenintegration? Wenn Ihre Organisation mit Big Data oder traditionellen relationalen Data Warehouses arbeitet, sind Sie möglicherweise an einer Datenintegrationslösung interessiert.
Verfügen Sie über die erforderlichen Programmierressourcen? Nicht jeder, der mit Daten arbeitet, hat Erfahrung mit dem Programmieren. Einige bevorzugen möglicherweise die Arbeit mit grafischen Tools, die Visualisierungen bereitstellen, um die Aufgaben zu erstellen, die mit Quelldaten arbeiten.
Müssen Sie mit mehreren Datenquellen arbeiten? Einige Organisationen können ihre Rohdaten in einer Reihe unterschiedlicher Systeme speichern, sowohl lokal als auch cloudbasiert. Eine Datenanalyselösung muss problemlos eine Verbindung mit vielen Datenquellen herstellen können.
Können Sie separate Datenintegrationskomponenten erstellen, verwalten und pflegen? Ohne einen verwalteten Dienst für Datenanalysen müssen Unternehmen benutzerdefinierte Datenverschiebungskomponenten erstellen. Alternativ können sie benutzerdefinierte Dienste erstellen, um ihre Datenquellen und die Verarbeitung zu integrieren. Die Integration und Pflege solcher Systeme kann teuer und schwierig sein. Darüber hinaus verfügen nicht alle diese Systeme über die Überwachung, Benachrichtigungen und Kontrollen, die ein vollständig verwalteter Dienst bietet.

Anwenden der Kriterien

Sehen Sie sich die folgenden Fragen an, wenn Sie Azure Data Factory als Datenintegrationslösung in Betracht ziehen.

Benötigen Sie überhaupt Datenintegration?

Wenn Ihre Organisation klein ist und mit begrenzten Datenquellen arbeitet, benötigen Sie möglicherweise überhaupt keinen Datenintegrationsdienst. Wenn Ihre Organisation jedoch mit Big Data oder traditionellen relationalen Data Warehouses arbeitet, können Sie möglicherweise von einer Datenintegrationslösung profitieren. Beachten Sie folgende Punkte:

  • Big Data-Organisationen nutzen Technologien für die Verarbeitung großer Mengen verschiedener Daten. Für sie bietet Azure Data Factory eine Möglichkeit zum Erstellen und Ausführen von Pipelines in der Cloud. Diese Pipelines können sowohl auf Clouddatendienste als auch auf lokale Datendienste zugreifen. Diese Pipelines funktionieren in der Regel mit Technologien wie Azure Synapse Analytics, Azure-Blobs und Azure Data Lake. Außerdem sind sie für Azure HDInsight, Azure Databricks und Azure Machine Learning geeignet.
  • Relationale Data Warehousing-Organisationen verwenden in der Regel Technologien wie SQL Server. SQL Server Integration Services (SSIS) wird häufig zum Erstellen von SSIS-Paketen verwendet. Für solche Organisationen bietet Azure Data Factory die Möglichkeit, SSIS-Pakete in Azure auszuführen und dadurch auf cloudbasierte und lokale Datendienste zuzugreifen.

Verfügen Sie über die erforderlichen Programmierressourcen?

Wenn Ihre Organisation nicht über die erforderlichen Programmierressourcen zum Erstellen der erforderlichen Aktivitäten verfügt, sollten Sie Azure Data Factory in Betracht ziehen. Azure Data Factory erfordert wenig bis keinen Programmieraufwand bei der Arbeit mit Datenquellen und den zugehörigen Aktivitäten. Beispielsweise können Sie Pipelines mit dem Erstellungs- und Überwachungstool von Azure Data Factory grafisch erstellen, indem Sie Aktivitäten per Drag & Drop auf eine Entwurfsoberfläche ziehen. Der folgende Screenshot zeigt die Benutzeroberfläche, in der ein Data Engineer eine Pipeline mit mehreren Aktivitäten erstellt:

Screenshot des Erstellungs- und Überwachungstools von Azure Data Factory.

Müssen Sie mit mehreren Datenquellen arbeiten?

Wenn Ihre Organisation auf Daten aus verschiedenen Speicherorten und Quellen zugreifen muss, müssen Sie eine Datenintegrationslösung in Betracht ziehen, die dies unterstützt. Azure Data Factory verwendet Connectors für die Integration mit unterschiedlichen Datenquellen. Derzeit werden mehr als 90 Datenquellen unterstützt. Darüber hinaus unterstützt Azure Data Factory erweiterbare Optionen, um zusätzliche Datenquellen zu erreichen.

Können Sie separate Datenintegrationskomponenten erstellen, verwalten und pflegen?

Das Erstellen und Verwalten Ihrer eigenen serverbasierten Datenintegrationslösung kann komplex und zeitaufwendig sein. Wenn eine solche Lösung innerhalb des Rechenzentrums Ihrer Organisation für Sie jedoch eine gute Lösung darstellt, müssen Sie Azure Data Factory nicht in Betracht ziehen. Es gibt jedoch Vorteile bei der Verwendung einer vollständig verwalteten, serverlosen Lösung für die Datenintegration. Zentrale Vorteile:

  • Skalierung kann nach Bedarf erfolgen, um weitere Workloads zu unterstützen.
  • Es ist nicht erforderlich, Server bereitzustellen, zu konfigurieren und zu warten, um Ihre Datenintegrationsworkloads zu hosten.

Zusammenfassung

Ziehen Sie Azure Data Factory in Betracht, wenn Sie mindestens eines der folgenden Kriterien erfüllen:

  • Ihren Data Engineers fehlt die erforderliche Zeit, um Programmcode zum Ausführen von Datenanalyseaufgaben zu schreiben.
  • Sie verfügen über mehrere Datenquellen an unterschiedlichen Speicherorten.
  • Sie möchten eine vollständig verwaltete, cloudbasierte Lösung nutzen.