将 DQS 配置为使用引用数据

本主题介绍如何将 Data Quality Services (DQS) 配置为使用参考数据来清理数据。 可以使用来自 Azure 市场 或直接联机第三方引用数据提供程序的引用数据。

开始之前

先决条件

若要使用来自市场的引用数据,您必须具有有效的市场帐户密钥。 有关创建市场帐户密钥的详细信息,请参阅 创建帐户 (https://go.microsoft.com/fwlink/?LinkId=212936) 。 还可以在Data Quality Client内创建市场帐户密钥,方法是在Data Quality Client主屏幕中单击“管理”下的“配置”,然后单击“引用数据”选项卡下的“创建 DataMarket 帐户 ID”。

安全性

权限

您必须具有 DQS_MAIN 数据库的 dqs_administrator 角色,才能在 DQS 中配置引用数据服务设置。

将 DQS 配置为使用来自市场的引用数据

  1. 启动数据质量客户端。 有关执行此操作的信息,请参阅运行 Data Quality Client 应用程序

  2. 在Data Quality Client主屏幕的“管理”下,单击“配置”。

  3. 如果您的组织使用代理服务器连接到 Internet,则在 “引用数据” 选项卡中的 “网络设置” 区域下,在 “代理服务器”“端口” 框中键入适当的值。

  4. “DataMarket 帐户 ID” 框中指定市场帐户密钥,然后单击 “验证 DataMarket 帐户 ID” 图标以验证该帐户密钥。 系统将显示一条消息,以显示指定的市场帐户密钥是否有效。

您现在可以在 DQS 中使用为指定的市场帐户密钥订阅的来自市场的引用数据服务。

将 DQS 配置为使用来自直接联机第三方引用数据提供程序的引用数据

  1. 启动数据质量客户端。 有关执行此操作的信息,请参阅运行 Data Quality Client 应用程序

  2. 在Data Quality Client主屏幕的“管理”下,单击“配置”。

  3. 如果您的组织使用代理服务器连接到 Internet,则在 “引用数据” 选项卡中的 “网络设置” 区域下,在 “代理服务器”“端口” 框中键入适当的值。

  4. “直接联机第三方引用数据服务设置” 区域中,单击 “添加新的引用数据服务提供程序” 图标。

  5. “创建新的直接联机第三方引用数据服务提供程序” 对话框中,指定以下详细信息:

    1. “名称” 框中,键入新的直接引用数据服务提供程序的名称。

    2. (可选)在 “说明” 框中,键入新的直接引用数据服务提供程序的说明。

    3. “类别” 框中,键入新的直接引用数据服务提供程序提供的数据类别。

    4. 在“架构”框中,指定一个架构,此架构定义要从直接引用数据服务提供程序中使用的字段(列名称)的字符串。 字段名称不能包含空格,且字段应该用逗号进行分隔。 例如:FirstName, LastName, City, State

    5. URI 框中,键入直接引用数据服务提供程序的 URI。 DQS 中仅允许安全 URI(地址以 “https://” 开头)。

    6. “最大批处理大小” 框中,键入将发送到引用数据服务提供程序以执行清理的每批的最大记录数。 可为清理活动指定每批最多 100 条记录。

    7. “帐户 ID” 框中,键入订阅引用数据服务提供程序的用户的帐户 ID。

  6. 单击 “确定” 以保存该数据,然后关闭 “创建新的直接联机第三方引用数据服务提供程序” 对话框。 新添加的直接联机第三方引用数据提供程序将可用于 DQS 的 “直接引用数据服务提供程序” 网格中。

您现在可以在 DQS 中使用新配置的直接联机第三方引用数据服务提供程序提供的引用数据服务。

跟进:将 DQS 配置为使用引用数据后

现在您必须将所需的知识库域映射到您刚配置的数据提供程序所提供的引用数据。 为此,请参阅 将域或复合域附加到引用数据