数据源概述

要配置 Dynamics 365 Customer Insights - Data,首先引入源数据进行处理。 Customer Insights - Data 提供多种类型的数据连接器,用于连接和引入来自广泛来源的数据。

本文介绍可能影响数据引入性能的选项。

Delta 格式

Delta 数据格式是 Customer Insights – Data 使用的本机处理格式。 如果您可以提供 Delta 格式的源数据,会有很多优点。

  • 使用 Customer Insights - Data 提高效率:Customer Insights - Data 在内部使用 Delta 格式。
  • 数据引入速度更快:Delta 格式提供卓越的压缩能力,可实现更快的数据传输。
  • 统一速度更快:使用 Delta 时间旅行功能时,Customer Insights - Data 仅统一有变化的数据。 不会重新处理整个数据集。 对于增量统一,统一的所有数据输入都必须采用 Delta 格式。
  • 减少数据损坏问题:Delta 格式可以减少由旧格式(如逗号分隔值 (CSV) 格式)导致的分区损坏和常见的数据损坏问题。
  • 更可靠的数据管理设计:Delta 格式不需要手动更新清单、架构和分区文件。
  • 数据有效性更高:Delta 格式可以在 Spark 中提供原子性、一致性、隔离、持久性 (ACID) 事务和隔离级别。

您可以将 Delta 格式用于以下连接器:

Delta 是在 Databricks Lakehouse 平台中存储数据和表的基础 Delta Lake 中引入的一个术语。 Delta Lake 是一个开源存储层,为大数据工作负载引入 ACID(原子性、一致性、隔离性和持久性)事务。 有关详细信息,请参阅 Delta Lake 文档页面

数据源附加或导入

当您决定如何引入数据时,一个关键的考虑因素是数据连接器是连接到数据还是复制数据。 当您使用 Customer Insights - Data 时,建议使用连接到数据的连接器。 这样,在要处理数据时可以直接访问数据。 如果您使用复制数据的连接器,在更新数据时可能会出现延迟。

以下数据连接器连接到您的数据:

如果您无法使用连接到数据的连接器,使用其中一个 Power Query 连接器复制数据。 Power Query 提供一种有用的转换数据的方法。

数据分析

引入数据时,Customer Insights – Data 会执行一些基本的数据分析。 例如,它会分析列中重复值的频率。 您可以使用配置文件数据来了解您的数据和解决问题。 例如,如果您在 FullName 列上进行匹配,数据分析可以帮助您检测 10,000 行中是否显示默认值输入您的姓名。 因此,如果在此值上匹配,将匹配不应匹配的 10,000 行。 当您添加 Azure data Lake、Delta 表或 Azure Synapse 数据源时,您可以为更多列启用数据分析。

引入数据后,您可以查看数据分析结果。

  1. 转到数据>,选择一个表。 然后,在字段(例如,DateOfBirth)的行,在摘要列,选择摘要图标。

    “客户”表页面上“属性”选项卡的屏幕截图,突出显示 DateOfBirth 字段的“摘要”图标。

  2. 查看详细信息中是否有错误或缺少值。

    显示 DateOfBirth 字段摘要的屏幕截图,包括按计数显示的最高值图表。

数据源页面

数据源页面分两个部分列出数据源:

  • 由我管理:您创建和管理的 Microsoft Power Platform 数据流。 其他用户只能查看这些数据流。 他们无法进行编辑、刷新或删除。
  • 由其他人管理:其他管理员创建的 Microsoft Power Platform 数据流。 您只能查看这些数据流。 此部分显示每个数据流的所有者,让您可以在需要任何帮助时与他们联系。

备注

其他用户可以查看和使用所有表。 每个数据源归创建它的用户所有,但 Customer Insights - Data 的每个用户都可以使用数据引入生成的所有

数据源页面的屏幕截图。

后续步骤