管理集成运行时

已完成

在数据工厂中,活动定义要执行的操作。 链接服务定义目标数据存储或计算服务。 集成运行时为活动和链接服务提供了基础结构。

Integration Runtime 由链接服务或活动引用,并提供在其上运行活动或从中分派活动的计算环境。 这样一来,可以在最接近目标数据存储的区域中执行活动,或者,以最优性能计算服务的同时满足安全和合规性需求。

简而言之,Integration Runtime (IR) 是 Azure 数据工厂使用的计算基础结构。 它在不同的网络环境中提供以下数据集成功能,包括:

  • 数据流:在托管的 Azure 计算环境中执行数据流。
  • 数据移动:跨公用网络中的数据存储和专用网络(本地或虚拟专用网络)中的数据存储复制数据。 它提供对内置连接器、格式转换、列映射以及性能和可扩展数据传输的支持。
  • 活动分派:分派和监视在各种计算服务(例如 Azure Databricks、Azure HDInsight、Azure 机器学习、Azure SQL 数据库、SQL Server 等)上运行的转换活动。
  • SSIS 包执行:在托管的 Azure 计算环境中本机执行 SQL Server 集成服务 (SSIS) 包。

每当创建 Azure 数据工厂实例时,都会创建一个默认的 Integration Runtime 环境,该环境支持对公用网络中的云数据存储和计算服务进行操作。 可在集成运行时设置为“自动解析”时查看此项

集成运行时类型

数据工厂提供三种类型的集成运行时,应选择最能满足你所寻求的数据集成功能和网络环境需求的类型。 这三种类型是:

  • Azure
  • 自承载
  • Azure-SSIS

可以在 connectVia 属性中显式定义 Integration Runtime 设置,如果未定义此设置,则使用默认的 Integration Runtime,并将属性设置为“自动解析”。

下表介绍了针对其中每个集成运行时类型提供的功能和网络支持:

IR 类型 公用网络 专用网络
Azure 数据流 数据流
数据移动 数据移动
活动分派 活动分派
自承载 数据移动 数据移动
活动分派 活动分派
Azure-SSIS SSIS 包执行 SSIS 包执行

确定要使用的集成运行时

有许多因素会影响你将使用的 Integration Runtime。 下面是可以帮助你选择合适的 IR 的指南

复制活动

对于复制活动,它需要使用源和接收器链接服务,以定义数据流的方向。 以下逻辑用于确定执行复制所使用的集成运行时实例的类型:

  • 在两个云数据源之间复制:当源和接收器链接服务都使用 Azure IR 时,ADF 会使用区域性的 Azure IR(如果已指定),或者自动确定 Azure IR 的位置,前提是你根据集成运行时位置部分的说明选择自动解析 IR(默认设置)。

  • 在云数据源和专用网络中的数据源之间复制:如果源或接收器链接服务指向自承载 IR,则在该自承载集成运行时上执行复制活动。

  • 在专用网络中的两个数据源之间复制:源和接收器链接服务必须指向集成运行时的同一个实例,而集成运行时用于执行复制活动。

查找和 GetMetadata 活动

查找和 GetMetadata 活动在关联到数据存储链接服务的集成运行时上执行。

转换活动

每个转换活动都有一个目标计算链接服务,该服务指向集成运行时。 该集成运行时实例是分派转换活动的实例。

数据流活动

数据流活动是在与其关联的集成运行时上执行的。