Azure Data Factory 的使用時機
在此單元中,我們將討論如何判斷您的組織是否適合使用 Azure Data Factory 資料整合解決方案。 我們會根據下列準則評估 Azure Data Factory:
- 對資料整合的需求
- 程式碼撰寫資源
- 對多個資料來源的支援
- 無伺服器基礎結構
決策準則
要判斷是否該使用 Azure Data Factory,請參考下表所述的準則。
準則 | 分析 |
---|---|
您是否需要資料整合? | 如果您的組織會處理到巨量資料,或是個傳統的關聯式資料倉儲組織,您可能會對資料整合解決方案感興趣。 |
您是否有必要的程式碼撰寫資源? | 不是所有處理資料的人都有撰寫程式碼的經驗。 有些人可能會想要使用圖形工具來提供視覺效果,以協助建立可處理來源資料的工作。 |
您是否需要使用多個資料來源? | 某些組織可能會將原始資料儲存在不同的系統中,包括內部部署和雲端式系統。 資料分析解決方案必須能夠輕鬆地連接到許多資料來源。 |
您可以建立、管理和維護個別的資料整合元件嗎? | 如果沒有適用於資料分析的受控服務,企業就必須建立自訂的資料移動元件。 或者,他們可能會建立自訂服務以整合其資料來源和流程。 整合和維護這類系統可能相當昂貴且困難。 此外,這類系統並非都有完全受控服務所提供的監視、警示和控制項功能。 |
套用準則
在考慮採用 Azure Data Factory 作為您的資料整合解決方案時,請再思考一遍下列問題。
您是否需要資料整合?
如果您的組織較小且僅需處理有限的資料來源,您可能完全不需要資料整合服務。 然而,如果您的組織會處理到巨量資料,或是個傳統的關聯式資料倉儲組織,資料整合解決方案則可能會對您有所助益。 請考慮下列幾點:
- 巨量資料組織依賴用來處理大量多樣化資料的技術。 對他們來說,Azure Data Factory 提供了在雲端中建立和執行管線的方法。 這些管線可以同時存取雲端和內部部署資料服務。 這些管線通常會與 Azure Synapse Analytics、Azure Blob 和 Azure Data Lake 等技術一同使用。 此外還有 Azure HDInsight、Azure Databricks 和 Azure Machine Learning。
- 關聯式資料倉儲組織通常依賴如 SQL Server 等的技術。 SQL Server Integration Services (SSIS) 通常用來建立 SSIS 套件。 對此類組織來說,Azure Data Factory 讓他們能在 Azure 上執行 SSIS 套件,並存取雲端和內部部署資料服務。
您是否有必要的程式碼撰寫資源?
如果您的組織缺少建立必要活動所需的程式碼資源,請考慮使用 Azure Data Factory。 Azure Data Factory 能提供低程式碼/無程式碼程式來處理資料來源和相關的活動。 舉例來說,Azure Data Factory 的製作和監視工具可讓您藉由將活動拖放至設計界面上,以圖形方式建立管線。 下列螢幕擷取畫面說明介面,其中的資料工程師正在建立具有數個活動的管線:
您是否需要使用多個資料來源?
如果您的組織需要存取多個位置中以及來自多個來源的資料,您便必須考慮提供這項支援的資料整合解決方案。 Azure Data Factory 使用連接器來整合不同的資料來源。 目前支援超過 90 個資料來源。 此外,Azure Data Factory 支援可延伸的選項,以連接到其他資料來源。
您可以建立、管理和維護個別的資料整合元件嗎?
建立及管理您自己以伺服器為基礎的資料整合解決方案可能相當複雜且耗時。 但是,如果您對於在組織的資料中心內執行這類解決方案感到可行,就不需考慮使用 Azure Data Factory。 不過,使用完全受控、無伺服器的資料整合解決方案有幾項優點。 主要優點包括:
- 視需要調整以支援其他工作負載的能力。
- 不需要部署、設定及維護伺服器來主控您的資料整合工作負載。
摘要
總而言之,當您符合下列其中一個或多個準則時,請考慮使用 Azure Data Factory:
- 您的資料工程師缺乏建立程式碼來執行資料分析工作所需的時間。
- 您有多個位於不同位置的資料來源。
- 您想要利用完全受控的雲端式解決方案。