数据源概述
要配置 Dynamics 365 Customer Insights - Data,首先引入源数据进行处理。 Customer Insights - Data 提供多种类型的数据连接器,用于连接和引入来自广泛来源的数据。
本文介绍可能影响数据引入性能的选项。
Delta 格式
Delta 数据格式是 Customer Insights – Data 使用的本机处理格式。 如果您可以提供 Delta 格式的源数据,会有很多优点。
- 使用 Customer Insights - Data 提高效率:Customer Insights - Data 在内部使用 Delta 格式。
- 数据引入速度更快:Delta 格式提供卓越的压缩能力,可实现更快的数据传输。
- 统一速度更快:使用 Delta 时间旅行功能时,Customer Insights - Data 仅统一有变化的数据。 不会重新处理整个数据集。 对于增量统一,统一的所有数据输入都必须采用 Delta 格式。
- 减少数据损坏问题:Delta 格式可以减少由旧格式(如逗号分隔值 (CSV) 格式)导致的分区损坏和常见的数据损坏问题。
- 更可靠的数据管理设计:Delta 格式不需要手动更新清单、架构和分区文件。
- 数据有效性更高:Delta 格式可以在 Spark 中提供原子性、一致性、隔离、持久性 (ACID) 事务和隔离级别。
您可以将 Delta 格式用于以下连接器:
Delta 是在 Databricks Lakehouse 平台中存储数据和表的基础 Delta Lake 中引入的一个术语。 Delta Lake 是一个开源存储层,为大数据工作负载引入 ACID(原子性、一致性、隔离性和持久性)事务。 有关详细信息,请参阅 Delta Lake 文档页面。
数据源附加或导入
当您决定如何引入数据时,一个关键的考虑因素是数据连接器是连接到数据还是复制数据。 当您使用 Customer Insights - Data 时,建议使用连接到数据的连接器。 这样,在要处理数据时可以直接访问数据。 如果您使用复制数据的连接器,在更新数据时可能会出现延迟。
以下数据连接器连接到您的数据:
- Azure Data Lake Storage Delta 表
- Azure Data Lake Storage Common Data Model 表
- Microsoft Dataverse
- Azure Synapse Analytics(预览版)
如果您无法使用连接到数据的连接器,使用其中一个 Power Query 连接器复制数据。 Power Query 提供一种有用的转换数据的方法。
数据分析
引入数据时,Customer Insights – Data 会执行一些基本的数据分析。 例如,它会分析列中重复值的频率。 您可以使用配置文件数据来了解您的数据和解决问题。 例如,如果您在 FullName
列上进行匹配,数据分析可以帮助您检测 10,000 行中是否显示默认值输入您的姓名。 因此,如果在此值上匹配,将匹配不应匹配的 10,000 行。 当您添加 Azure data Lake、Delta 表或 Azure Synapse 数据源时,您可以为更多列启用数据分析。
引入数据后,您可以查看数据分析结果。
转到数据>表,选择一个表。 然后,在字段(例如,
DateOfBirth
)的行,在摘要列,选择摘要图标。查看详细信息中是否有错误或缺少值。
数据源页面
数据源页面分两个部分列出数据源:
- 由我管理:您创建和管理的 Microsoft Power Platform 数据流。 其他用户只能查看这些数据流。 他们无法进行编辑、刷新或删除。
- 由其他人管理:其他管理员创建的 Microsoft Power Platform 数据流。 您只能查看这些数据流。 此部分显示每个数据流的所有者,让您可以在需要任何帮助时与他们联系。
备注
其他用户可以查看和使用所有表。 每个数据源归创建它的用户所有,但 Customer Insights - Data 的每个用户都可以使用数据引入生成的所有表。