在 Microsoft Fabric 中从 Azure 数据工厂获取数据工厂
Microsoft Fabric 中的数据工厂是下一代 Azure 数据工厂,提供云规模数据移动和数据转换服务,可帮助你应对非常复杂的 ETL 场景。 它旨在使你的体验易于使用、功能强大且真正企业级。 本文比较 Microsoft Fabric 中 Azure 数据工厂与数据工厂之间的差异。
功能映射
在 Fabric 中的数据工厂的新式体验中,与 Azure 数据工厂相比,存在一些不同的功能概念。 详细特征映射如下表所示。
Azure 数据工厂 | Fabric 中的数据工厂 | 说明 |
---|---|---|
管道 | 数据管道 | Fabric 中的数据管道与统一数据平台(包括 Lakehouse、数据仓库等)的集成更加紧密。 |
映射数据流 | Dataflow Gen2 | Dataflow Gen2 为编译转换提供更简单的体验。 我们正在使 Dataflow Gen2 中支持更多映射数据流功能 |
活动 | 活动 | 我们正在使 Fabric 中的数据工厂支持更多 ADF 活动。 Fabric 中的数据工厂也新增了一些有吸引力的活动,例如 Office 365 Outlook 活动。 活动概述中提供了详细信息。 |
数据集 | 不适用 | Fabric 中的数据工厂没有数据集概念。 连接用于连接每个数据源并提取数据。 |
链接服务 | 连接 | 连接具有与链接服务类似的功能,但 Fabric 中的连接具有更直观的创建方式。 |
触发器 | 计划触发器和文件事件触发器 | Fabric 可以使用计划程序和 Reflex 事件自动运行管道。 Microsoft Fabric 数据工厂的管道中原生支持文件事件触发器。 |
发布 | 保存、运行 | 对于 Fabric 中的管道,无需发布即可保存内容。 而可以使用“保存”按钮直接保存内容。 选择“运行”按钮时,它会在运行管道之前保存内容。 |
Autoresolve 和 Azure Integration Runtime | 不适用 | 在 Fabric 中,我们没有集成运行时的概念。 |
自承载集成运行时 | 本地数据网关 | 借助本地数据网关可以通过 Fabric 数据工厂访问本地数据。 详细信息请参阅如何在 Microsoft Fabric 的数据工厂中访问本地数据源。 |
Azure-SSIS 集成运行时 | 待定 | Fabric 中的功能尚未确认路线图和设计。 |
MVNet 和专用终结点 | 待定 | Fabric 中的功能尚未确认路线图和设计。 |
表达式语言 | 表达式语言 | 表达式语言在 ADF 和 Fabric 中类似。 |
链接服务中的身份验证类型 | 连接中的身份验证类型 | Fabric 管道中的身份验证类型已在 ADF 中支持常用身份验证类型,并且添加了更多身份验证类型。 |
CI/CD | CI/CD | Fabric 数据工厂中的 CI/CD 功能即将推出。 |
导出和导入 ARM | 另存为 | “另存为”在 Fabric 管道中可用于复制管道。 |
监视 | 监视、运行历史记录 | Fabric 中的监视中心具有更高级的功能和现代体验,例如跨不同工作区进行监视,以获取更好的见解。 |
Microsoft Fabric 中数据工厂的数据管道
Microsoft Fabric 的数据工厂中有许多令人兴奋的数据管道功能。 利用这些功能,可以在 Fabric 中感受管道的强大功能。
湖屋/数据仓库集成
湖屋和数据仓库可用作 Fabric 管道中的来源和目标,因此构建你自己与湖屋和数据仓库集成的项目非常方便。
Office 365 outlook 活动
Office 365 outlook 活动提供一种直观而简单的方式,可以通过简单的配置发送关于管道和活动的信息以及管道输出的自定义电子邮件通知。
获取数据体验
Fabric 中的数据工厂中提供了新式且简单的“获取数据”体验,因此设置复制管道和创建新连接的速度非常快。
现代监视体验
结合监视中心和数据工厂项目的功能,如数据流和数据管道,我们可以获取所有工作负载的完整视图,并深入了解数据工厂体验中的任何活动。 通过监视中心进行跨工作区分析也很方便。
管道复制监视结果可提供复制活动的明细详情。 选择“运行详细信息”按钮(突出显示了眼镜图标)以查看运行详细信息。 展开“持续时间”细分,可以了解复制活动中每个阶段的持续时间。
另存为
Fabric 管道中的“另存为”为你提供一种便利的方法来复制现有管道用于其他开发目的。