在复制活动中配置 Microsoft 365
Microsoft Fabric Data 管道与 Microsoft Graph 数据连接集成,允许你以可缩放的方式将 Microsot 365 租户中的丰富组织数据引入 Fabric 和 Azure,并生成分析应用程序和基于这些有价值的数据资产提取见解。 与 Privileged Access Management 的集成为 Microsoft 365 中组织有序的有价值的数据提供安全访问控制。 有关 Microsoft Graph 数据连接的概述,请参阅此链接。
本文概述如何使用数据管道中的复制活动从 Microsoft 365 复制数据。 目前,在单个复制活动中,只能将数据从 Microsoft 365 引入 Microsoft Fabric Lakehouse Table、Azure Blob Storage、Azure Data Lake Storage Gen1 和 Azure Data Lake Storage Gen2 中。 支持的数据格式为 Avro、带分隔符的文本、JSON、ORC 和 Parquet 格式。
先决条件
要从 Microsoft 365 复制数据,需要完成下列必备步骤:
- Microsoft 365 租户管理员必须完成载入操作,如此处所述。
- 在 Microsoft Entra ID 中创建和配置 Microsoft Entra Web 应用程序。 有关说明,请参阅创建 Microsoft Entra 应用程序。
- 记下以下值,这些值将用于定义 Microsoft 365 的连接:租户 ID。 有关说明,请参阅获取租户 ID。
- 应用程序 ID 和身份验证密钥。 有关说明,请参阅获取应用程序 ID 和身份验证密钥。 添加用户标识,其将作为 Microsoft Entra Web 应用程序的所有者发出数据访问请求(从 Microsoft Entra Web 应用程序 >设置>所有者>添加所有者)。
- 用户标识必须位于你从中获取数据的 Microsoft 365 组织中,并且不能是来宾用户。
批准新的数据访问请求
如果这是你首次请求数据(要访问的数据表、要将数据加载到的目标帐户和发出数据访问请求的用户标识的组合)的数据,则复制活动状态将显示为“正在进行”。 只有在选择“操作”下的“详细信息”链接时,状态才会显示为 RequestingConsent。 在继续执行数据提取之前,数据访问审批者组的成员需要在 Privileged Access Management 中审批该请求。
请参阅有关审批者如何批准数据访问请求的常见问题。 有关与 Privileged Access Management 的整体集成的说明,包括如何设置数据访问审批者组,请参阅数据连接与 PAM 集成一文。
支持的配置
有关复制活动下每个选项卡的配置,请分别转到以下各部分。
常规
对于“常规”选项卡配置,请转到“常规”。
源
复制活动的“源”选项卡下的 Microsoft 365 支持以下属性。
需要以下属性:
- 数据存储类型:选择”外部”。
- 连接:从连接列表中选择 Microsoft 365 连接。 如果不存在连接,则通过选择”新建“创建新的 Microsoft 365 连接。
- 表:要从 Microsoft 365 中提取的表的名称。 可以通过选择“预览示例数据”来预览示例数据。
在“高级”下,可以指定以下字段:
范围:可以在 Microsoft 365 租户中选择所有用户或组 ,也可以从 Microsoft 365 租户中选择组
如果在 Microsoft 365 租户中选择所有用户或组,则会显示范围筛选器。
- 范围筛选器:可以使用在整个租户上应用的谓词表达式来筛选要从 Microsoft 365 中提取的特定行。 谓词格式应当与 Microsoft Graph API 的查询格式匹配,例如
https://graph.microsoft.com/v1.0/users?$filter=Department eq 'Finance'
。
如果选择“从 Microsoft 365 租户中选择组”,则可以选择“添加用户组”以从 Microsoft 365 租户中选择组。 可以使用此属性选择最多 10 个将为其检索数据的用户组。 如果未指定任何组,则会为整个组织返回数据。
- 范围筛选器:可以使用在整个租户上应用的谓词表达式来筛选要从 Microsoft 365 中提取的特定行。 谓词格式应当与 Microsoft Graph API 的查询格式匹配,例如
日期筛选器:指定 DateTime 筛选器列的名称。 可以使用此属性限制要提取 Microsoft 365 数据的时间范围。 如果数据集有一个或多个 DateTime 列,则需要在此处指定一列。 有关需要此日期/时间筛选器的数据集的列表,请参阅筛选。
指定“开始时间 (UTC)”和“结束时间 (UTC)”,以在选择 DateTime 筛选器列时进行筛选。
映射
对于“映射”选项卡配置,请转到“映射”选项卡下的“配置映射”。
设置
对于“设置”选项卡配置,请转到“设置”选项卡下的“配置其他设置”。
表摘要
下表包含有关 Microsoft 365 中复制活动的详细信息。
源信息
名称 | 描述 | 值 | 必选 | JSON 脚本属性 |
---|---|---|---|---|
数据存储类型 | 你的数据存储类型。 | 外部 | 是 | / |
Connection | 与源数据存储的连接。 | <你的连接> | 是 | 连接 |
Table | 要从 Microsoft 365 中提取的表的名称。 | <table> | 是 | 表 |
范围 | 未指定用户组时,可以使用在整个租户上应用的谓词表达式来筛选要从 Microsoft 365 中提取的特定行。 谓词格式应当与 Microsoft Graph API 的查询格式匹配,例如 https://graph.microsoft.com/v1.0/users?$filter=Department eq 'Finance' 。 |
<你的范围> | 是 | scope |
范围筛选器 | 未指定 allowedGroups 属性时,可以使用在整个租户上应用的谓词表达式来筛选要从 Microsoft 365 中提取的特定行。 谓词格式应当与 Microsoft Graph API 的查询格式匹配,例如 https://graph.microsoft.com/v1.0/users?$filter=Department eq 'Finance' 。 |
<范围筛选器> | 否 | userScopeFilterUri |
组 ID | 组选择谓词。 可以使用此属性选择最多 10 个将为其检索数据的用户组。 如果未指定任何组,则会为整个组织返回数据。 | <组 ID> | 否 | allowedGroups |
日期筛选器 (列名称) |
日期/时间筛选器列的名称。 可以使用此属性限制要提取 Microsoft 365 数据的时间范围。 | <日期/时间筛选器列> | 如果数据有一个或多个日期/时间列,则为必需的。 | dateFilterColumn |
开始时间 (UTC) | 筛选时所依据的开始日期/时间值。 | <开始时间> | 如果指定了 dateFilterColumn ,则为必需的 |
startTime |
结束时间 (UTC) | 筛选时所依据的结束日期/时间值。 | <结束时间> | 如果指定了 dateFilterColumn ,则为必需的 |
endTime |