管理整合執行階段
在 Data Factory 中,活動可定義要執行的動作。 連結服務可定義目標資料存放區或計算服務。 整合執行階段提供活動與連結服務之間的基礎結構。
Integration Runtime 會提供參考給連結服務或活動,並提供可在其中執行活動或從中分派活動的計算環境。 如此一來,就能在最接近目標資料存放區或計算服務的區域執行活動,效率最高,又滿足安全性和合規性需求。
簡單來說,Integration Runtime (IR) 是 Azure Data Factory 所使用的計算基礎結構。 IR 可橫跨不同的網路環境提供下列資料整合功能,包括:
- 資料流程:在受控的 Azure 計算環境中執行資料流程。
- 資料移動:在公用網路中的資料存放區與私人網路 (內部部署或虛擬私人網路) 中的資料存放區之間複製資料。 可支援內建的連接器、格式轉換、資料行對應,以及高效能和可調式資料轉送。
- 活動分派:分派和監視在 Azure Databricks、Azure HDInsight、Azure Machine Learning、Azure SQL Database、SQL Server 等各種計算服務上執行的轉換活動。
- SSIS 套件執行:在受控 Azure 計算環境中,以原生方式執行 SQL Server Integration Services (SSIS) 套件。
每當建立 Azure Data Factory 執行個體時,就會建立預設的 Integration Runtime 階段環境,來支援在公用網路中的雲端資料存放區和計算服務上的作業。 當整合執行階段設定為「自動解析」時,可以檢視此情況
整合執行階段類型
Data Factory 提供三種整合執行階段,建議選擇最符合所需之資料整合功能和網路環境需求的類型。 這三種類型為:
- Azure
- 自我裝載
- Azure-SSIS
您可以在 connectVia 屬性中明確定義 Integration Runtime 階段設定,如果未定義,則會使用預設的 Integration Runtime,並將屬性設定為「自動解析」。
下表描述每個整合執行階段類型的功能和網路支援:
IR 類型 | 公用網路 | 私人網路 |
---|---|---|
Azure | 資料流程 | 資料流程 |
資料移動 | 資料移動 | |
活動分派 | 活動分派 | |
自我裝載 | 資料移動 | 資料移動 |
活動分派 | 活動分派 | |
Azure-SSIS | SSIS 封裝執行 | SSIS 封裝執行 |
決定要使用的整合執行階段
有許多因素會影響您要使用的 Integration Runtime。 以下指南可協助您選取正確的 IR
複製活動
對於複製活動,需要來源和接收連結服務來定義資料流程的方向。 下列邏輯可決定使用哪個整合執行階段執行個體來執行複製:
在兩個雲端資料來源之間複製:當來源和接收連結服務皆使用 Azure IR 時,ADF 將會在您已指定區域 Azure IR 時使用該 IR,或在您選擇自動解析 IR (預設值) 時自動判斷 Azure IR 的位置,如整合執行階段位置一節所說明。
在雲端資料來源與私人網路中的資料來源之間複製:如果任一來源或接收連結服務指向自我裝載 IR,則會在自我裝載整合執行階段上執行複製活動。
在私人網路中的兩個資料來源之間複製:來源和接收連結服務必須指向相同的整合執行階段執行個體,而該整合執行階段會用來執行複製活動。
查閱和 GetMetadata 活動
查閱和 GetMetadata 的活動會在與資料存放區連結服務相關聯的整合執行階段上執行。
轉換活動
每個轉換活動都有一個指向整合執行階段的目標計算「連結服務」。 轉換活動就是從這個整合執行階段執行個體分派而來。
資料流程活動
資料流程活動會在與其相關聯的整合執行時間上執行。