Partilhar via


Anexar domínio ou domínio composto a dados de referência - Data Quality Services (DQS)

Aplica-se a:SQL Server

Este tópico descreve como ligar domínios/domínios compostos numa base de conhecimento de qualidade de dados a um serviço de dados de referência no Azure Marketplace para desenvolver conhecimento com base em dados de referência de alta qualidade. Cada serviço de dados de referência contém um esquema (colunas de dados). Depois de anexar um domínio ou um domínio composto a um serviço de dados de referência, você deve mapear o domínio anexado ou os domínios individuais dentro do domínio composto anexado para as colunas apropriadas em um esquema de serviço de dados de referência. Anexar um domínio composto a um serviço de dados de referência permite anexar apenas um domínio a um serviço de dados de referência e, em seguida, mapear os domínios individuais dentro do domínio composto para colunas apropriadas no esquema do serviço de dados de referência.

Importante

Este artigo menciona serviços de dados de referência de terceiros que estavam disponíveis anteriormente no Azure DataMarket. O DataMarket e o Data Services - incluindo os dados de endereço da Melissa, por exemplo - foram descontinuados após 31/12/2016. Como resultado, você não pode mais executar os exemplos neste artigo com os serviços especificados do DataMarket. Você ainda pode usar serviços de dados de referência que estão disponíveis diretamente on-line de provedores de dados de referência de terceiros.

Advertência

O domínio composto anexado a um serviço de dados de referência está disponível na lista suspensa de domínios enquanto se mapeiam os domínios nas colunas no esquema de serviço de dados de referência. Não mapeie o domínio composto para uma coluna no esquema do serviço de dados de referência; Você só deve mapear domínios individuais dentro de um domínio composto para as colunas apropriadas no esquema do Serviço de Dados de Referência. Caso contrário, resultará em um erro.

Um esquema de serviço de dados de referência pode ter uma coluna obrigatória que deve ser mapeada com o domínio apropriado caso você opte por usar o serviço de dados de referência. A coluna obrigatória em um esquema de dados de referência é identificada com "(M)" contra o nome da coluna. Por exemplo, AddressLine é a coluna de esquema obrigatória no Melissa Data - Address Data e CompanyName é a coluna de esquema obrigatória na Digital Trowel Inc. - empresas dos EUA e dados profissionais para utilizadores de SQL.

Neste tópico, criaremos quatro domínios: Address Line, City, Statee Zip, em um domínio composto, Address Verification, anexe o domínio composto ao Melissa Data - Address Check serviço de dados de referência e, em seguida, mapeie os domínios individuais dentro do domínio composto para colunas apropriadas no esquema do serviço de dados de referência.

Antes de começar

Pré-requisitos

Você deve ter configurado o Data Quality Services (DQS) para usar serviços de dados de referência. Consulte Configurar o DQS para usar dados de referência.

Segurança

Permissões

Você deve ter a função dqs_kb_editor no banco de dados DQS_MAIN para mapear domínios para dados de referência.

Mapear domínios para fazer referência a dados da Melissa Data

  1. Inicie o Data Quality Client. Para obter informações sobre como fazer isso, consulte executar a aplicação cliente de Qualidade de Dados.

  2. Na ecrã inicial do Cliente de Qualidade de Dados, em Gestão da Base de Conhecimento, clique em Nova Base de Conhecimento.

  3. Na tela Nova base de conhecimento, digite um nome para a nova base de conhecimento, clique na atividade Gerenciamento de Domínio e clique em Criar.

  4. Na tela Gerenciamento de Domínio, clique no ícone Criar um domínio para criar um domínio. Crie os quatro domínios a seguir: Address Line, City, Statee Zip.

  5. Clique no ícone Criar um domínio composto para criar um domínio composto. Na caixa de diálogo Criar um domínio composto, digite Verificação de Endereço na caixa Nome de Domínio Composto, e inclua todos os domínios criados na etapa 3 no domínio composto. Clique OK.

  6. No painel Domínio no lado esquerdo, selecione o domínio composto clicando em Verificação de Endereço , e, em seguida, clique na guia Dados de Referência no lado direito.

  7. Clique no ícone Navegar.

  8. Na caixa de diálogo Catálogo de Provedores de Dados de Referência Online :

    1. Em DataMarket Data Quality Services, marque a caixa Melissa Data - Address Check .

    2. Mapeie as colunas do serviço de dados de referência Melissa Data - Address Check com os domínios apropriados (Address Line, City, State e Zip). Para mapear as colunas, selecione uma coluna de serviço de dados de referência na coluna esquema do RDS e, em seguida, selecione o domínio apropriado na coluna domínio. Para adicionar mais linhas na tabela, clique no ícone Adicionar Entrada de Esquema.

    3. Clique OK para salvar as alterações e feche a caixa de diálogo Catálogo de Provedores de Dados de Referência Online.

      Caixa de Diálogo Catálogo de Provedores de Dados de Referência Online

      Observação

      • Na caixa de diálogo Catálogo de Provedores de Dados de Referência Online, o nó DataMarket Data Quality Services exibe todos os provedores de serviços de dados de referência que você subscreveu no Azure Marketplace. Se você configurou provedores de serviços de dados de referência de terceiros on-line diretos no DQS, eles aparecerão em outro nó chamado 3rd Party Direct Online Providers (não disponível agora, pois nenhum provedor de serviços de dados de referência de terceiros on-line direto está configurado no DQS).
  9. Você irá voltar à guia Dados de Referência . Na área Configurações do Provedor, altere os valores nas seguintes caixas, se necessário.

    • Limite de Correção Automática: As correções do serviço de dados de referência com nível de confiança acima desses valores de limite serão feitas automaticamente. Insira um valor na notação decimal do valor percentual correspondente. Por exemplo, digite 0,9 para 90%.

    • Candidatos Sugeridos: Número de candidatos sugeridos a apresentar a partir do serviço de dados de referência.

    • Min Confidence: As sugestões do serviço de dados de referência com nível de confiança inferior a este valor serão ignoradas. Insira um valor na notação decimal do valor percentual correspondente. Por exemplo, digite 0.6 para 60%.

  10. Clique Concluir para publicar a base de conhecimento. Uma mensagem de confirmação é exibida depois que a base de dados de conhecimento é publicada com êxito.

Agora pode usar esta base de conhecimento para a atividade de limpeza em um projeto de qualidade de dados, para padronizar e limpar endereços dos EUA nos seus dados de origem, com base nos conhecimentos fornecidos pela Melissa Data no Azure Marketplace.

Acompanhamento: Depois de mapear um domínio para dados de referência

Crie um projeto de qualidade de dados e execute a atividade de limpeza em seus dados de origem contendo endereços dos EUA, comparando-os com a base de dados de conhecimento criada neste tópico. Consulte o conhecimento Limpeza de dados utilizando dados de referência externos.

Ver também

Serviços de Dados de Referência no DQS
Limpeza de Dados