数据统一概述
在设置数据源后,您可以统一数据。 统一将您的各种客户数据源合并在一起,并为每个客户创建一个客户配置文件记录。 统一消除了重复数据,并将来自各种数据源的所有重要字段合并为一个记录,消除了数据孤岛。
可以对单个表或多个表统一数据。 表以前称为实体。
数据统一过程
统一流程由四个步骤组成:
客户数据:选择包含姓名、电话和地址等客户配置文件信息的源数据。 不要包含客户活动数据,如与客户具有一对多关系的购买。 将列映射到描述性类型。
删除重复项:定义规则来查找一个客户的多个行,并选择最适合的行来代表客户。 重复数据删除规则可删除重复行,以帮助确保获得最佳统一结果。
匹配条件:定义在两个表之间匹配客户记录的规则。 匹配规则创建包含每个表中的所有列和数据的单个合并记录。
统一数据视图:确定应在统一客户配置文件中包含、排除或合并源表中的哪些列。 例如,如果统一六个表,每个表都有一个电子邮件列,可以将它们合并为一个电子邮件列。
客户 ID
统一运行时,系统会为每个客户配置文件分配一个唯一的 CustomerId。 除以下两种情况外,此 ID 在统一运行之间不会更改。
合并配置文件当存在两个或多个统一配置文件,并且源数据或规则发生更改,让源数据现在匹配时,下一次统一运行会在之前存在多个客户配置文件的位置创建一个客户配置文件。 新合并的客户配置文件会被分配以前的 CustomerId 之一。 在极少数情况下,可能会分配新 CustomerId,例如,当在合并的一个或两个统一配置文件发生很多更改时。 合并的客户配置文件的 PreviousCustomerId 字段显示以前的 CustomerId,或者在适当的情况下显示用分号分隔的多个 CustomerId。
拆分配置文件当存在一个统一客户配置文件,并且源数据或规则发生更改,让记录不再匹配时,下一次统一运行会在之前存在一个客户配置文件的位置创建两个或多个客户配置文件。 一个记录会保留以前的 CustomerID,而其他记录则会被分配新 CustomerID。 具有新分配的 CustomerId 的客户配置文件的 PreviousCustomerId 字段将显示配置文件从其拆分的 CustomerId。
另请参见
- 设置表之间的关系以创建复杂客户细分。
- 扩充数据以深入了解客户。
- 从某些引入的列定义活动。
- 生成度量以更好地了解客户行为和业务绩效。
- FastTrack 博客:数据建模的最佳做法
- FastTrack 博客:不相关源的高级统一场景