为方案选择正确的集成运行时配置

集成运行时 (IR) 是 Purview Microsoft用于跨不同网络环境进行数据扫描的计算基础结构。 本文介绍 Microsoft Purview 中可用的不同类型的集成运行时,并提供有关如何为方案选择正确的集成运行时配置的指南。

集成运行时的类型

Microsoft Purview 提供以下类型的集成运行时:

  • Azure 集成运行时:Azure 集成运行时是一种完全托管的弹性计算,可用于扫描 Azure 或非 Azure 数据源。 Azure IR 支持通过可公开访问的终结点连接到数据存储和计算服务。 这是默认的集成运行时,无需创建任何内容即可开始使用。
  • 托管虚拟网络 (VNet) 集成运行时:可以创建托管 VNet 集成运行时,该运行时驻留在 Microsoft Purview 托管虚拟网络中。 它可以使用专用终结点安全地连接到受支持的数据源并对其进行扫描。 有关详细信息,请参阅托管虚拟网络和托管专用终结点
  • 自承载集成运行时:自承载集成运行时可用于扫描本地网络或虚拟网络中的数据源。 可以在本地计算机或专用网络内的虚拟机上安装它。 有关详细信息,请参阅 创建和管理自承载集成运行时
  • Kubernetes 支持的自承载集成运行时 (预览版) :此集成运行时托管在 Kubernetes 群集上,可用于扫描本地网络或虚拟网络中的数据源。 Kubernetes 支持提高了整体性能,并允许集成运行时与作业一起缩放。 有关详细信息,请参阅 创建和管理 Kubernetes 支持的自承载集成运行时
  • AWS 集成运行时:AWS 集成运行时是由 AWS 中的 Microsoft Purview 托管的完全托管且弹性的。 它适用于扫描 S3、RDS 等 Amazon 数据源。

选择正确的集成运行时

选择适当的集成运行时类型非常重要。 它不仅必须适合现有的体系结构和数据集成要求,而且还需要考虑如何进一步满足不断增长的业务需求和将来增加的工作负载。

以下注意事项可帮助你导航决策:

  1. 要扫描哪些数据源类型?

    查看 支持的数据源 部分,了解要扫描的数据源支持的 IR 类型。

  2. 数据源的网络访问控制是什么?

    不同的数据源可能具有不同的网络防火墙设置,以保护它免受通过 Internet 的随机访问,可能是本地或云/SaaS 数据存储。 下表列出了一些常见的防火墙选项。 可以根据方案选择支持的 IR 类型。

    数据源防火墙 Azure IR 托管 VNet IR SHIR Kubernetes 支持的 SHIR
    允许公共访问
    允许 Azure 服务受信任的服务
    允许从特定 Azure 虚拟网络进行访问 • 使用托管专用终结点支持 ()
    允许特定 IP/IP 范围
    其他本地或专用网络访问
  3. Microsoft Purview 的防火墙设置是什么?

    Microsoft Purview 提供了不同的网络防火墙选项。 有关详细信息,请参阅 配置 Microsoft Purview 防火墙。 可以根据方案选择支持的 IR 类型。

    Purview 防火墙 Azure IR 托管 VNet IR SHIR Kubernetes 支持的 SHIR
    从所有网络启用
    从所有网络禁用 ✓ 需要 (托管专用终结点) • (需要从网络) 创建专用终结点 • (需要从网络) 创建专用终结点
  4. 在数据传输过程中需要什么安全级别?

    集成运行时位置定义其后端计算的位置以及执行扫描操作的位置。 对于数据驻留注意事项:

    • 使用 Azure IR 时,Microsoft Purview 会自动检测数据源的位置,并使用该区域中的 IR。 如果Microsoft Purview 无法检测到该区域,则使用 Purview 帐户的区域。
    • 使用托管 VNet IR 时,它在为托管虚拟网络配置的区域中运行。
    • 使用 SHIR 时,可以完全决定本地或 Azure 虚拟机中的位置。

    例如,为了抵御数据传输过程中的中间人攻击,可以选择使用专用终结点和专用链接来确保数据安全。

    • 使用托管 VNet IR 时,可以为数据存储创建托管专用终结点。 专用终结点由托管虚拟网络中的 Microsoft Purview 服务维护。
    • 还可以在虚拟网络中创建专用终结点,SHIR 可以使用它们来访问数据存储。
  5. 你可以提供什么级别的维护?

    维护基础结构、服务器和设备是企业 IT 部门的重要任务之一。 它通常需要大量的时间和精力。

    • 使用 Azure IR 和托管 VNet IR 时,无需担心更新、修补和版本等维护问题。 Microsoft Purview 服务负责所有维护工作。
    • 由于 SHIR 安装在计算机上,并且 Kubernetes 支持的 SHIR 位于 Kubernetes 群集上,因此需要管理维护。
  6. 性能和可伸缩性

    建议使用完全托管且自动缩放的 Azure IR、托管 VNet IR 或 Kubernetes 支持的自承载集成运行时(如果适用)。 借助弹性,它们可以为你提供更好的性能和可伸缩性,尤其是在扫描大规模数据系统时。

支持的数据源

下表显示了 Microsoft Purview 扫描支持的所有数据源,以及支持的集成运行时类型。

类别 支持的数据存储 Azure IR/AWS IR 托管 VNet IR SHIR Kubernetes SHIR
Azure 多个源
Azure Blob 存储 ✓ (包括托管专用终结点)
Azure Cosmos DB (API for NoSQL) ✓ (包括托管专用终结点)
Azure 数据资源管理器 ✓ 仅 (v2)
Azure Data Lake Storage Gen1 ✓ 仅 (v2)
Azure Data Lake Storage Gen2 ✓ (包括托管专用终结点)
Azure Database for MySQL ✓ (包括托管专用终结点)
Azure Database for PostgreSQL ✓ (包括托管专用终结点)
Azure Databricks Hive 元存储
Azure Databricks Unity 目录 ✓ 仅 (v2,包括托管专用终结点)
Azure 专用 SQL 池(以前称为 SQL DW) ✓ (包括托管专用终结点)
Azure 文件 ✓ (包括托管专用终结点)
Azure SQL 数据库 ✓ (包括托管专用终结点)
Azure SQL 托管实例 ✓ (包括托管专用终结点)
Azure Synapse Analytics (工作区) ✓ (包括托管专用终结点)
Database Amazon RDS
Amazon Redshift
Cassandra ✓ 仅 (v2)
Db2
Google BigQuery
Hive 元存储数据库
Mongodb
MySQL ✓ 仅 (v2,包括托管专用终结点)
Oracle
PostgreSQL ✓ 仅 (v2)
SAP Business Warehouse
SAP HANA
Snowflake ✓ 仅 (v2)
SQL Server
Azure-Arc 上的SQL Server
Teradata
文件 Amazon S3
HDFS
服务和应用 Dataverse ✓ 仅 (v2)
Erwin
Looker ✓ 仅 (v2)
织物 ✓ 仅 (v2)
Power BI ✓ 仅 (v2)
Qlik Sense ✓ 仅 (v2)
Salesforce ✓ 仅 (v2)
SAP ECC
SAP S/4HANA
画面 ✓ 仅 (v2)