将数据导出到 Azure Synapse Analytics(预览版)
[本文为预发布文档,可能会发生变化。]
备注
Azure Active Directory 现已更名为 Microsoft Entra ID。 了解更多
Azure Synapse 是一项分析服务,可加缩短跨数据存储和大型数据系统进行深入了解的时间。 您可以在 Azure Synapse 中引入和使用您的 Dynamics 365 Customer Insights - Data 数据。
小费
Azure Synapse Link for Dataverse 是一项正式发布的服务,提供从 Microsoft Dataverse 到 Azure data Lake 的无缝、连续的数据复制。 我们建议您使用 Azure Synapse Link for Dataverse 而不是 Customer Insights 数据传出导出来进一步对 Customer Insights 生成的表进行数据处理,如:
- 统一客户配置文件 (msdynci_customerprofile)
- 统一活动 (msdynci_unifiedactivity)
- 客户细分成员身份 (msdynci_segmentmembership)
- 客户属性度量 (msdynci_customermeasure)
- 扩充数据安全 (msdynci_enrichment)
- 预测模型输出 (msdynci_prediction)
有关表架构的详细信息,请参阅 Customer Insights - Data 中的表
先决条件
备注
确保如上所述设置所有角色分配。
- 在 Customer Insights - Data 中,您的 Microsoft Entra ID 帐户必须具有管理员角色。
在 Azure 中:
一个有效的 Azure 订阅。
在 Customer Insights - Data 中具有管理员角色的用户需要 Azure 订阅中的用户访问管理员角色,来授予对 Customer Insights - Data UI 中的 Azure 资源的服务主体访问权限。 否则,Azure 中具有用户访问管理员角色的用户必须设置以下权限。 了解有关用户访问管理员角色的更多信息,以及如何在负责人与用户访问管理员之间进行选择。 负责人隐式具有用户访问管理员角色。
如果使用新的 Azure Data Lake Storage Gen2 帐户,则 Customer Insights - Data 的服务主体具有存储 Blob 数据参与者权限。 必须为 Data Lake Storage Gen2 启用分层命名空间。
在具有 Azure Synapse workspace 的资源组上,需要为服务主体和 Customer Insights - Data 中具有管理员权限的用户至少分配读者权限。
Customer Insights - Data 中具有管理员权限的用户具有对数据所在并链接到 Azure Synapse workspace 的 Azure Data Lake Storage Gen2 帐户拥有存储 Blob 数据参与者权限。 详细了解如何使用 Azure 门户分配用于访问 blob 和队列数据的 Azure 角色和存储 Blob 数据参与者权限。
如果数据位于并链接到 Azure Synapse workspace,则 Azure Synapse workspace 托管标识具有对 Azure Data Lake Storage Gen2 帐户的存储 Blob 数据参与者权限。 详细了解如何使用 Azure 门户分配用于访问 blob 和队列数据的 Azure 角色和存储 Blob 数据参与者权限。
在 Azure Synapse workspace 中,Customer Insights - Data 的服务主体分配有 Synapse 管理员角色。
如果您的 Customer Insights - Data 环境将数据存储在您自己的 Azure Data Lake Storage中,设置与 Azure Synapse Analytics 的连接的用户至少需要 Data Lake Storage 帐户的内置读者角色。 有关详细信息,请参阅使用 Azure 门户分配 Azure 角色。
已知限制
- 如果环境使用自定义 Azure data Lake 进行数据存储,Azure Synapse 导出不支持数据源的增量刷新。
- 只有当您的环境将数据存储在您自己的 Azure Data Lake Storage 中时,才支持将 Power Query 数据源作为输入表。
- 在设置 Azure 专用链接后启用对您自己的存储帐户的公共访问将不起作用。 仅当您禁用对存储帐户的公共访问时,才支持专用链接。 删除“专用链接”设置可以重新启用公共访问。
- 此导出仅对 CSV 格式的文件有效。
设置与 Azure Synapse 的连接
您必须是 Customer Insights - Data 中的管理员才能添加连接。
转到设置>连接。
选择添加连接并选择 Azure Synapse Analytics。
在显示名称字段中为连接指定易于识别的名称。 连接的名称和类型描述了此连接。 我们建议选择一个名称来解释此连接的用途和目标。
选择可使用此连接的人员。 默认情况下,仅限管理员。 有关更多信息,请参阅允许参与者使用连接进行导出。
选择或搜索要在其中使用 Customer Insights 的订阅。 一旦选择了订阅,还可以马上选择工作区、存储帐户和容器。
(可选)如果存储帐户位于防火墙后面,选择启用专用链接。 有关详细信息,请转到专用链接。
查看数据隐私和合规性,并选择我同意。
选择保存以完成连接。
配置导出
要配置此导出,您必须具有此连接类型的权限。 要使用共享连接配置导出,您需要在 Customer Insights - Data 中至少具有参与者权限。
转到数据>导出。
选择添加导出。
在导出连接字段中,从 Azure Synapse Analytics 部分选择连接。 如果没有连接可用,请联系管理员。
为导出提供一个可识别的显示名称和一个数据库名称。 导出将在连接中定义的工作区中创建一个新的 Azure Synapse 湖数据库。
选择要导出到 Azure Synapse Analytics 的表。
备注
不支持基于 Common Data Model 文件夹的数据源。
选择保存。
保存导出不会立即运行导出。 每次进行预定的刷新 时,都会运行导出。 您也可以按需导出数据。
要查询 Synapse Analytics 中的数据,您需要具有对导出工作区上的目标存储的存储 Blob 数据读者访问权限。
更新导出
转到数据>导出。
在想要更新的导出上选择编辑。
在选择的内容中添加或删除表。 如果从选择的内容中删除了表,这些实体会在 Synapse Analytics 数据库中保留。 但是,以后的数据刷新不会更新该数据库中删除的表。
更改数据库名称会创建一个新的 Synapse Analytics 数据库。 旧数据库在以后刷新时不会收到任何更新。