在复制活动中配置 Microsoft 365

Microsoft Fabric Data 管道与 Microsoft Graph 数据连接集成,允许你以可缩放的方式将 Microsot 365 租户中的丰富组织数据引入 Fabric 和 Azure,并生成分析应用程序和基于这些有价值的数据资产提取见解。 与 Privileged Access Management 的集成为 Microsoft 365 中组织有序的有价值的数据提供安全访问控制。 有关 Microsoft Graph 数据连接的概述,请参阅此链接

本文概述如何使用数据管道中的复制活动从 Microsoft 365 复制数据。 目前,在单个复制活动中,只能将数据从 Microsoft 365 引入 Microsoft Fabric Lakehouse Table、Azure Blob Storage、Azure Data Lake Storage Gen1 和 Azure Data Lake Storage Gen2 中。 支持的数据格式为 Avro、带分隔符的文本、JSON、ORC 和 Parquet 格式。

先决条件

要从 Microsoft 365 复制数据,需要完成下列必备步骤:

  • Microsoft 365 租户管理员必须完成载入操作,如此处所述。
  • 在 Microsoft Entra ID 中创建和配置 Microsoft Entra Web 应用程序。 有关说明,请参阅创建 Microsoft Entra 应用程序
  • 记下以下值,这些值将用于定义 Microsoft 365 的连接:租户 ID。 有关说明,请参阅获取租户 ID
  • 应用程序 ID 和身份验证密钥。 有关说明,请参阅获取应用程序 ID 和身份验证密钥。 添加用户标识,其将作为 Microsoft Entra Web 应用程序的所有者发出数据访问请求(从 Microsoft Entra Web 应用程序 >设置>所有者>添加所有者)。
  • 用户标识必须位于你从中获取数据的 Microsoft 365 组织中,并且不能是来宾用户。

批准新的数据访问请求

如果这是你首次请求数据(要访问的数据表、要将数据加载到的目标帐户和发出数据访问请求的用户标识的组合)的数据,则复制活动状态将显示为“正在进行”。 只有在选择“操作”下的“详细信息”链接时,状态才会显示为 RequestingConsent。 在继续执行数据提取之前,数据访问审批者组的成员需要在 Privileged Access Management 中审批该请求。

请参阅有关审批者如何批准数据访问请求的常见问题。 有关与 Privileged Access Management 的整体集成的说明,包括如何设置数据访问审批者组,请参阅数据连接与 PAM 集成一文。

支持的配置

有关复制活动下每个选项卡的配置,请分别转到以下各部分。

常规

对于“常规”选项卡配置,请转到“常规”。

复制活动的“源”选项卡下的 Microsoft 365 支持以下属性。

Screenshot showing source tab.

需要以下属性:

  • 数据存储类型:选择”外部”
  • 连接:从连接列表中选择 Microsoft 365 连接。 如果不存在连接,则通过选择”新建“创建新的 Microsoft 365 连接。
  • :要从 Microsoft 365 中提取的表的名称。 可以通过选择“预览示例数据”来预览示例数据。

“高级”下,可以指定以下字段:

  • 范围:可以在 Microsoft 365 租户中选择所有用户或组 ,也可以从 Microsoft 365 租户中选择组

    如果在 Microsoft 365 租户中选择所有用户或组,则会显示范围筛选器。

    Screenshot showing scope filter.

    • 范围筛选器:可以使用在整个租户上应用的谓词表达式来筛选要从 Microsoft 365 中提取的特定行。 谓词格式应当与 Microsoft Graph API 的查询格式匹配,例如 https://graph.microsoft.com/v1.0/users?$filter=Department eq 'Finance'

    如果选择“从 Microsoft 365 租户中选择组”,则可以选择“添加用户组”以从 Microsoft 365 租户中选择组。 可以使用此属性选择最多 10 个将为其检索数据的用户组。 如果未指定任何组,则会为整个组织返回数据。

    Screenshot showing group details.

  • 日期筛选器:指定 DateTime 筛选器列的名称。 可以使用此属性限制要提取 Microsoft 365 数据的时间范围。 如果数据集有一个或多个 DateTime 列,则需要在此处指定一列。 有关需要此日期/时间筛选器的数据集的列表,请参阅筛选

    指定“开始时间 (UTC)”“结束时间 (UTC)”,以在选择 DateTime 筛选器列时进行筛选。

    Screenshot showing data filter.

映射

对于“映射”选项卡配置,请转到“映射”选项卡下的“配置映射”

设置

对于“设置”选项卡配置,请转到“设置”选项卡下的“配置其他设置”

表摘要

下表包含有关 Microsoft 365 中复制活动的详细信息。

源信息

名称 描述 必选 JSON 脚本属性
数据存储类型 你的数据存储类型。 外部 /
Connection 与源数据存储的连接。 <你的连接> 连接
Table 要从 Microsoft 365 中提取的表的名称。 <table>
范围 未指定用户组时,可以使用在整个租户上应用的谓词表达式来筛选要从 Microsoft 365 中提取的特定行。 谓词格式应当与 Microsoft Graph API 的查询格式匹配,例如 https://graph.microsoft.com/v1.0/users?$filter=Department eq 'Finance' <你的范围> scope
范围筛选器 未指定 allowedGroups 属性时,可以使用在整个租户上应用的谓词表达式来筛选要从 Microsoft 365 中提取的特定行。 谓词格式应当与 Microsoft Graph API 的查询格式匹配,例如 https://graph.microsoft.com/v1.0/users?$filter=Department eq 'Finance' <范围筛选器> userScopeFilterUri
组 ID 组选择谓词。 可以使用此属性选择最多 10 个将为其检索数据的用户组。 如果未指定任何组,则会为整个组织返回数据。 <组 ID> allowedGroups
日期筛选器
(列名称)
日期/时间筛选器列的名称。 可以使用此属性限制要提取 Microsoft 365 数据的时间范围。 <日期/时间筛选器列> 如果数据有一个或多个日期/时间列,则为必需的。 dateFilterColumn
开始时间 (UTC) 筛选时所依据的开始日期/时间值。 <开始时间> 如果指定了 dateFilterColumn,则为必需的 startTime
结束时间 (UTC) 筛选时所依据的结束日期/时间值。 <结束时间> 如果指定了 dateFilterColumn,则为必需的 endTime