设置域属性
本主题介绍如何在 Data Quality Services (DQS) 中设置域属性。
本主题内容
开始之前:
必备条件
安全性
设置域属性
跟进:设置域属性后
域属性
域名和说明
数据类型
使用前导值
规范化字符串
将输出格式设置为
语言
启用拼写检查器
禁用语法错误算法
开始之前
必备条件
若要为域设置属性,您必须创建了知识库和域。
安全性
权限
您必须对 DQS_MAIN 数据库具有 dqs_kb_editor 或 dqs_administrator 角色,才能设置域属性。
[返回页首]
设置域属性
通过在域管理活动中打开某一知识库(请参阅打开知识库),然后在**“域”**列表中选择适当的域,对某一现有域设置属性。 默认情况下,将显示“域属性”页。
在按照创建域中所述创建一个新域后设置其属性。
单击**“完成”**以完成域管理活动,如结束域管理活动中所述。
[返回页首]
跟进:设置域属性后
在设置域属性后,您可以对域执行其他域管理任务,可以执行知识发现以便向域添加知识,或者可以向域添加匹配策略。 有关详细信息,请参阅执行知识发现、管理域或创建匹配策略。
[返回页首]
域属性
域名和说明
一旦创建了一个域后,就可以更改该域名或说明。 对于知识库而言,域名必须唯一。 说明最多可以有 256 个字符。
数据类型
在您选择域后,为域中的值选择以下数据类型之一:String(默认设置)、Date、Integer 或 Decimal。 在创建了域之后,可以查看数据类型,但不能更改数据类型。 为某个域选择的数据类型将定义可映射到该域的源数据的类型。 有关 DQS 中四个域数据类型的支持的数据类型的信息,请参阅DQS 域支持的 SQL Server 和 SSIS 数据类型。
使用前导值
选中此复选框可指定将输出一组同义词中的前导值,而非是其同义词的值。 取消选择**“使用前导值”**可指定每个同义词值以其正确或更正形式输出,并且不会被其组的前导值替换。
规范化字符串
如果数据类型为 String,则选中此复选框以忽略源数据中的特殊字符。 DQS 会在数据加载到域中时在内部用 null 或空格替换特殊字符。 冒号、连字符、句点、双引号或分号将替换为空格。 单引号将替换为 null。 使用 null 可使字符串的两个部分成为一体。
忽略字符串值中的特殊字符可提高匹配精确性。 可以通过使用 null 或空格替换特殊字符来增加两个字符串之间的相似性分数。 标点符号或其他符号可以轻松地在不同字符串之间进行区分。 通过在内部替换特殊字符,可使分数能够超过 DQS 中的最低匹配阈值,导致尚未匹配的两个字符串最终匹配。 但是,您是否选择忽略特殊字符可能依赖于您对其执行匹配的数据类型。 例如,当您在英制度量系统中使用数据时,如果双引号表示英寸,单引号表示英尺,则忽略产品数据中的双引号和单引号可能会导致误报。
当在发现、匹配策略、匹配项目和清理项目活动的数据处理阶段中加载和索引数据时,执行规范化。 如果启用,规范化和基于字词的关系转换都是在分析前的预处理阶段中进行的。 在应用计算字符串之间相似性的任何算法前对每个域执行它们。 如果请求复合域分析,将在规范化和基于字词的关系转换前执行分析,因为分隔符分析要求符号。 其他操作(例如域规则和域值更改)将会在转换后执行。 在 DQS 中内部替换特殊字符不会更改结果数据。
将输出格式设置为
选择在输出域中的数据值时要采用的格式。 此格式设置特定于选定的数据类型,如下面的列表中所示。 选择**“无”**意味着将不会在列表中应用任何格式。
对于字符串值,您可以指定字符串将是输出为大写、小写还是首字母大写。
对于日期值,您可以指定日、月和年的格式。
对于整数值,您可以指定要应用的格式掩码的类型。
对于小数值,您可以指定要应用的格式掩码的精确性和类型。
语言
如果数据类型为 String,则选择为用于拼写检查器操作而要将域与之关联的语言。 此选择仅适用于拼写检查器,因为拼写检查器结果取决于所用语言。 此选择仅适用于数据类型为字符串的单一域。 语言属性与复合域无关。 复合域中每个部分的语言由相关的单一域确定。
英语为默认语言。 将**“语言”属性设置为“其他”**将为该域禁用拼写检查器。
![]() |
---|
如果您的语言未列在“语言”下拉列表中,则必须选择“其他”。 这可确保 DQS 根据域中可用的知识(域规则、域值、TBR、匹配规则),清理和消除未列出的语言数据的重复项。 有关清理和匹配未列出的语言的详细信息,请参阅此博客文章:DQS 进行清理和匹配时所支持的语言。 |
启用拼写检查器
如果数据类型是 String,则单击可为该域启用 DQS 拼写检查器。 拼写检查器仅适用于数据类型为字符串的域。 **“启用拼写检查器”**复选框使拼写检查器仅适用于与该复选框相关联的单一域。 该复选框不适用于复合域。
拼写检查器会对域中的值建议语法和验证更正。 有关详细信息,请参阅使用 DQS 拼写检查器。
禁用语法错误算法
如果数据类型为 String,则选择此选项可指定在清理期间在域中 DQS 将不会标识语法错误。 在为该域标识语法错误无关紧要时选中此复选框。 例如,标识语法错误可能对于序列号无意义。 此控制仅可用于字符串数据类型。 DQS 不会检查非字符串数据类型是否有语法错误。
[返回页首]