管理集成运行时
在数据工厂中,活动定义要执行的操作。 链接服务定义目标数据存储或计算服务。 集成运行时为活动和链接服务提供了基础结构。
Integration Runtime 由链接服务或活动引用,并提供在其上运行活动或从中分派活动的计算环境。 这样一来,可以在最接近目标数据存储的区域中执行活动,或者,以最优性能计算服务的同时满足安全和合规性需求。
简而言之,Integration Runtime (IR) 是 Azure 数据工厂使用的计算基础结构。 它在不同的网络环境中提供以下数据集成功能,包括:
- 数据流:在托管的 Azure 计算环境中执行数据流。
- 数据移动:跨公用网络中的数据存储和专用网络(本地或虚拟专用网络)中的数据存储复制数据。 它提供对内置连接器、格式转换、列映射以及性能和可扩展数据传输的支持。
- 活动分派:分派和监视在各种计算服务(例如 Azure Databricks、Azure HDInsight、Azure 机器学习、Azure SQL 数据库、SQL Server 等)上运行的转换活动。
- SSIS 包执行:在托管的 Azure 计算环境中本机执行 SQL Server 集成服务 (SSIS) 包。
每当创建 Azure 数据工厂实例时,都会创建一个默认的 Integration Runtime 环境,该环境支持对公用网络中的云数据存储和计算服务进行操作。 可在集成运行时设置为“自动解析”时查看此项
集成运行时类型
数据工厂提供三种类型的集成运行时,应选择最能满足你所寻求的数据集成功能和网络环境需求的类型。 这三种类型是:
- Azure
- 自承载
- Azure-SSIS
可以在 connectVia 属性中显式定义 Integration Runtime 设置,如果未定义此设置,则使用默认的 Integration Runtime,并将属性设置为“自动解析”。
下表介绍了针对其中每个集成运行时类型提供的功能和网络支持:
IR 类型 | 公用网络 | 专用网络 |
---|---|---|
Azure | 数据流 | 数据流 |
数据移动 | 数据移动 | |
活动分派 | 活动分派 | |
自承载 | 数据移动 | 数据移动 |
活动分派 | 活动分派 | |
Azure-SSIS | SSIS 包执行 | SSIS 包执行 |
确定要使用的集成运行时
有许多因素会影响你将使用的 Integration Runtime。 下面是可以帮助你选择合适的 IR 的指南
复制活动
对于复制活动,它需要使用源和接收器链接服务,以定义数据流的方向。 以下逻辑用于确定执行复制所使用的集成运行时实例的类型:
在两个云数据源之间复制:当源和接收器链接服务都使用 Azure IR 时,ADF 会使用区域性的 Azure IR(如果已指定),或者自动确定 Azure IR 的位置,前提是你根据集成运行时位置部分的说明选择自动解析 IR(默认设置)。
在云数据源和专用网络中的数据源之间复制:如果源或接收器链接服务指向自承载 IR,则在该自承载集成运行时上执行复制活动。
在专用网络中的两个数据源之间复制:源和接收器链接服务必须指向集成运行时的同一个实例,而集成运行时用于执行复制活动。
查找和 GetMetadata 活动
查找和 GetMetadata 活动在关联到数据存储链接服务的集成运行时上执行。
转换活动
每个转换活动都有一个目标计算链接服务,该服务指向集成运行时。 该集成运行时实例是分派转换活动的实例。
数据流活动
数据流活动是在与其关联的集成运行时上执行的。