排查 Dynamics 365 客户透视 中的统一输出表问题 - 数据
输出表简介
数据统一过程的每个步骤都会生成系统生成的输出表。
若要对意外的统一结果进行故障排除,可以跟踪以下输出表:
步长 | 表 | 说明 |
---|---|---|
重复数据删除 | Deduplication_{Datasource}_{Table} | 每个源表的重复数据删除记录 |
匹配 | ConflationMatchPairs | 跨源表匹配的记录 |
合并 | 客户 | 统一客户配置文件 |
有关每个输出表的详细说明,请参阅 “了解输出表”。
查看输出表
方法 | 大小 | 重复数据删除 | ConflationMatchPairs | 客户 |
---|---|---|---|---|
下载 100K 条记录 | 前 100K | ✔ | ✔ | ✔ |
设置导出 | 完全 | ✔ | ✔ | ✔ |
创建沙盒环境 | 完全 | ✔ | ✔ | ✔ |
方法 1:下载 10 万条记录
如果记录少于 100,000 条,请使用此方法。
在 客户透视 - 数据中,打开“表”页。 对于每个输出表,选择“下载”以获取该表的最新 100,000 条记录。
若要确保此方法包含所有输出信息,请参阅 方法 3:创建沙盒环境。
方法 2:设置导出
如果记录超过 100,000 条,请使用此方法。
对于每个输出表, 设置导出。 建议 导出到 Blob 存储。
刷新所有导出,然后将完整表写入配置的位置。
方法 3:创建沙盒环境
创建新的沙盒环境 ,以重新创建包含原始表问题记录子集的表的统一配置。
此步骤确保 方法 1:下载 10 万条记录 包含所有输出信息。
数据源
创建仅包含一小部分问题记录的新表。 建议少于 100,000 条记录。
刷新表以将它们引入客户透视 - 数据。
统一问题表
- 映射问题表。
- 将原始重复数据删除规则复制到问题表。
- 对于每个问题表:
- 复制原始匹配规则。
- 启用 “包括所有记录 ”,以便更好地了解数据。
- 在 统一数据视图 步骤中,保留默认配置。
- 运行统一以生成客户配置文件。
解决统一结果
根据意外结果的位置,可能需要验证不同的输出表。
请参阅 说明统一结果的示例。
重复数据删除
若要验证重复数据删除是否按预期进行,请检查:
- 有问题的结果的源数据
- 重复数据删除配置
请确保考虑所有配置,例如:
- 标准化
- Precision
- 异常
- 合并首选项
请参阅“定义重复数据删除规则”中的重复数据删除概念和重复数据删除概念和方案中的示例的概述。
匹配
若要验证匹配是否按预期进行,请检查:
- 有问题的结果的源数据
- 相关的 重复数据删除 记录
- 匹配配置
请确保考虑所有配置,例如:
- 匹配顺序
- 扩充
- 标准化
- Precision
- 异常
- 自定义匹配条件
- 合并首选项
请参阅定义用于数据统一的匹配规则中的匹配概念的概述。
合并
若要验证合并是否按预期进行,请检查:
- 有问题的结果的源数据
- 相关的 重复数据删除 记录
- 相关 联合会MatchPairs 记录
- 合并配置
请确保考虑所有配置,例如:
- 排除的字段
- 群集
- 合并首选项
- 分组字段
- 自定义 ID 生成。
请参阅“统一客户”列中合并行为的 概述,了解数据统一 和 示例。
了解输出表
重复数据删除表
重复数据删除表是由配置的规则删除的源表。 如果没有配置的规则,则源表在匹配规则中引用的列上重复数据删除。
列 | 源 | 类型 | 描述 |
---|---|---|---|
PrimaryKey | Source | 字符串 | 配置的 源主键 |
PrimaryKey_Alternate | 系统 | 字符串 | 为重复数据删除组标识的主键的串联列表 |
重复数据删除组...DeduplicationGroup_N | 系统 | 字符串 | 基于重复数据删除规则的类似记录组的标识符 |
统治。。。Rule_N | 系统 | 字符串 | 重复数据删除组匹配的重复数据删除规则 |
得分。。。Score_N | 系统 | 双精度 | 重复数据删除规则返回的分数 |
Deduplication_WinnerId | 系统 | 字符串 | 重复数据删除组的获胜主键 |
其他映射字段 | Source | 各种 | 源表中的剩余映射字段 |
ConflationMatchPairs 表
ConflationMatchPairs 表是基于已配置规则的匹配重复数据删除记录集。
列 | 源 | 类型 | 描述 |
---|---|---|---|
TrueObjectId | 系统 | 字符串 | 跨源表匹配的记录的临时标识符 |
PrimaryKey...PrimaryKey_N | Source | 字符串 | 匹配的源主键 |
PrimaryKey_Alternate...PrimaryKey_Alternate_N | 系统 | 字符串 | 匹配的源主键的备用键 |
ConflationMatchPairs_ModifiedOn | 系统 | 日期和时间 | 此匹配记录的最新更改的时间戳 |
其他匹配字段 | Source | 各种 | 源表中剩余的映射字段 |
Customer 表
Customer 表是基于统一字段的配置合并 ConflationMatchPairs 中的源列生成的最终客户配置文件集。
列 | 源 | 类型 | 说明 |
---|---|---|---|
CustomerId | 系统 | 字符串 | 配置文件的唯一 GUID 标识符 |
PrimaryKey...PrimaryKey_N | Source | 字符串 | 匹配的源主键 |
PrimaryKey_Alternate...PrimaryKey_Alternate_N | 系统 | 字符串 | 匹配的源主键的备用键 |
统一字段 | Source | 各种 | 通过将统一字段配置应用到源字段来确定的最终字段 |
统一结果的示例
源表
MyData_Contact
ContactId | 名字 | 姓氏 | 电子邮件 |
---|---|---|---|
1 | 汤姆森 | monica.thomson@contoso.com |
|
2 | Monica | Smith | monica.thomson@contoso.com |
MyData_Referral
Id | FirstName | 姓氏 | EmailAddress | ReferralDate |
---|---|---|---|---|
100 | Moni | 汤姆森 | monica.thomson@contoso.com |
2024 年 1 月 1 日凌晨 12:00 |
200 | Monica | Smith | monica.thomson@contoso.com |
2020 年 12 月 24 日上午 12:00 |
重复数据删除表
Deduplication_MyData_Contact
如果删除重复 Email
数据:
ContactId | ContactId_Alternate | Deduplication_GroupId | 规则 | 分数 | Deduplication_WinnerId | 名字 | 姓氏 | 电子邮件 |
---|---|---|---|---|---|---|---|---|
1 | 1;2 | guid() | DedupOnEmail | 1.0 | 1 | 汤姆森 | monica.thomson@contoso.com |
Deduplication_MyData_Referral
如果删除重复 EmailAddress
数据:
Id | Id_Alternate | Deduplication_GroupId | 规则 | 分数 | Deduplication_WinnerId | 名字 | 姓氏 | EmailAddress | ReferralDate |
---|---|---|---|---|---|---|---|---|---|
100 | 100;200 | guid() | DedupOnEmailAddress | 1.0 | 100 | Moni | 汤姆森 | monica.thomson@contoso.com |
2024 年 1 月 1 日凌晨 12:00 |
ConflationMatchPairs 表
如果匹配:Contact.Email == Referral.Email
TrueObjectId | Contact_ContactId | Contact_ContactId_Alternate | Referral_Id | Referral_Id_Alternate | ConflationMatchPairs_ModifiedOn | Contact_FirstName | Contact_LastName | Contact_Email | Referral_FirstName | Referral_LastName | Referral_EmailAddress | Referral_ReferralDate |
---|---|---|---|---|---|---|---|---|---|---|---|---|
1__00 | 1 | 1;2 | 100 | 100;200 | now() | 汤姆森 | monica.thomson@contoso.com |
Moni | 汤姆森 | monica.thomson@contoso.com |
2024 年 1 月 1 日凌晨 12:00 |
Customer 表
如果按如下所示设置统一字段:
- FirstName:
Contact.FirstName
优先于Referral.FirstName
. - LastName:
Contact.LastName
优先于Referral.LastName
. - 电子邮件:
Contact.Email
优先于Referral.EmailAddress
。 - ReferralDate:
Referral.ReferralDate
是采用的。
CustomerId | Contact_ContactId | Contact_ContactId_Alternate | Referral_Id | Referral_Id_Alternate | 名字 | 姓氏 | 电子邮件 | ReferralDate |
---|---|---|---|---|---|---|---|---|
guid() | 1 | 1;2 | 100 | 100;200 | Moni | 汤姆森 | monica.thomson@contoso.com |
2024 年 1 月 1 日凌晨 12:00 |