模糊分组转换编辑器(“列”选项卡)
使用**“模糊分组转换编辑器”对话框的“列”**选项卡可以指定用于对带有重复值的行进行分组的列。
若要了解有关模糊分组转换的详细信息,请参阅模糊分组转换。
选项
- 可用输入列
从此列表中选择用于对带有重复值的行进行分组的输入列。
- 名称
查看可用输入列的名称。
- 传递
选择是否在转换的输出中包含输入列。用于分组的所有列将自动复制到输出中。通过选中此列可以包含其他列。
- 输入列
选择先前在**“可用输入列”**列表中选中的一个输入列。
- 输出别名
为相应的输出列输入一个描述性名称。默认情况下,输出列名称与输入列名称相同。
- 组输出别名
为包含分组重复项的规范值的列输入一个描述性名称。此输出列的默认名称是在输入列名称后面追加 _clean。
- 匹配类型
选择模糊匹配或完全匹配。在指定了模糊匹配类型的所有列中,如果某些行足够相似,则会将这些行视为重复。如果还对某些列指定了完全匹配,则只会将在完全匹配列中包含相同值的行视为可能重复。因此,如果知道特定列中没有错误或不存在不一致的情况,则可以对该列指定完全匹配以提高其他列模糊匹配的准确性。
- 最低相似性
使用滑块在联接级别设置相似性阈值。该值越接近 1,查找值与源值的相似性必须越接近,才能视为匹配。由于需要考虑的候选记录更少,因此增加阈值可以提高匹配的速度。
- 相似性输出别名
为包含所选联接相似性得分的新输出列指定名称。如果将该值保留为空,将不会创建输出列。
数字
指定比较列数据时前导数字和尾随数字的重要性。例如,如果前导数字重要,则“123 Main Street”将不会与“456 Main Street”分组在一起。值 说明 Neither
前导数字和尾随数字都不重要。
Leading
只有前导数字重要。
Trailing
只有尾随数字重要。
LeadingAndTrailing
前导数字和尾随数字都重要。
- 比较标志
有关字符串比较选项的信息,请参阅比较字符串数据。
请参阅
其他资源
Integration Services Error and Message Reference
如何使用模糊分组转换标识相似数据行