Azure Data Factory を使用するケース
このユニットでは、Azure Data Factory が自分の組織に適したデータ統合ソリューションであるかどうかを判断する方法について説明します。 Azure Data Factory を以下の基準に照らして評価します。
- データ統合の要件
- コーディング リソース
- 複数のデータ ソースのサポート
- サーバーレス インフラストラクチャ
意思決定の基準
Azure Data Factory を使用するかどうかを判断するには、次の表に示す基準を使用します。
条件 | 分析 |
---|---|
データ統合は本当に必要か? | 組織がビッグ データを扱うか、従来のリレーショナル データ ウェアハウス組織の場合、データ統合ソリューションに関心を示すかもしれません。 |
必要なコーディング リソースがあるか? | データを扱うすべての人にコーディングの経験があるわけではありません。 ソース データを扱うタスクの作成に役立つ視覚化が提供されるグラフィカル ツールの使用を好む人もいます。 |
複数のデータ ソースを扱う必要があるか? | 組織によっては、オンプレミスとクラウドベースの両方のさまざまな異種システムに生データが格納されている場合があります。 データ分析ソリューションでは、多くのデータ ソースに簡単に接続できる必要があります。 |
個別のデータ統合コンポーネントを作成、管理、保守できるか? | データ分析用のマネージド サービスがない場合、企業はカスタム データ移動コンポーネントを構築する必要があります。 または、データ ソースと処理を統合するカスタム サービスを作成する場合もあります。 このようなシステムの統合と保守はコストがかかり、困難な場合があります。 さらに、このようなシステムのすべてが、フル マネージド サービスによって提供される監視、アラート、制御を備えているとは限りません。 |
基準を適用する
Azure Data Factory をデータ統合ソリューションとして検討する場合は、次の質問を確認してください。
データ統合は本当に必要か?
組織が小規模で、限られたデータ ソースを扱う場合は、データ統合サービスはそもそも必要ない可能性があります。 ただし、組織がビッグ データを扱うか、従来のリレーショナル データ ウェアハウス組織の場合、データ統合ソリューションの恩恵を受ける可能性があります。 次の点を考慮します。
- ビッグ データ組織は、大量の多様なデータを処理するテクノロジに依存します。 これらの方たちに向けて、Azure Data Factory には、クラウドにパイプラインを作成して実行する手段が用意されています。 これらのパイプラインから、クラウドとオンプレミスの両方のデータ サービスにアクセスできます。 これらのパイプラインは通常、Azure Synapse Analytics、Azure BLOB、Azure Data Lake などのテクノロジと連携して動作します。 また、Azure HDInsight、Azure Databricks、Azure Machine Learning もそうです。
- リレーショナル データ ウェアハウス組織は、通常、SQL Server などのテクノロジに依存します。 SQL Server Integration Services (SSIS) は、SSIS パッケージの作成によく使用されます。 このような組織に対して、Azure Data Factory は、Azure で SSIS パッケージを実行する機能を提供し、組織がクラウドとオンプレミスの両方のデータ サービスにアクセスできるようにします。
必要なコーディング リソースがあるか?
必須アクティビティを作成するために必要なコーディング リソースが組織に不足している場合は、Azure Data Factory を検討してください。 Azure Data Factory には、データ ソースと関連アクティビティを処理するロー コードおよびノー コードのプロセスが用意されています。 たとえば、Azure Data Factory の作成および監視ツールを使用すると、デザイン サーフェイスにアクティビティをドラッグ アンド ドロップして、パイプラインをグラフィカルに作成できます。 次のスクリーンショットは、データ エンジニアがいくつかのアクティビティを含むパイプラインを作成しているインターフェイスを示しています。
複数のデータ ソースを扱う必要があるか?
組織に複数の場所にある複数のソースからのデータにアクセスしなければならないという要件がある場合は、このサポートを提供するデータ統合ソリューションについて検討する必要があります。 Azure Data Factory では、異種のデータ ソースと統合するためにコネクタを使用します。 現在、90 個を超えるデータ ソースがサポートされています。 さらに、Azure Data Factory は、その他のデータ ソースにアクセスするための拡張可能なオプションもサポートしています。
個別のデータ統合コンポーネントを作成、管理、保守できるか?
独自のサーバーベースのデータ統合ソリューションを作成して管理するのは、非常に複雑で時間がかかる可能性があります。 しかし、このようなソリューションを組織のデータセンター内で実行することに問題がない場合は、Azure Data Factory を検討する必要はありません。 ただし、データ統合のためのフル マネージドのサーバーレス ソリューションを使用することには利点があります。 主な利点:
- 追加のワークロードをサポートする必要に応じてスケーリングできる機能。
- データ統合ワークロードをホストするためにサーバーを配置、構成、および管理する必要がない。
まとめ
まとめると、次の基準を 1 つ以上満たす場合に Azure Data Factory を検討してください。
- データ エンジニアに、データ分析タスクを実行するコードを作成するために必要な時間がない。
- まったく異なる場所に複数のデータ ソースがある。
- フル マネージドのクラウドベースのソリューションを活用したい。