Anexar domínio/domínio composto para dados de referência
Este tópico descreve como anexar domínios/domínios compostos em uma base de dados de conhecimento de qualidade de dados para um serviço de dados de referência, no Windows Azure Marketplace, a fim de compilar o conhecimento com base nos dados de referência de alta qualidade. Cada serviço de dados de referência contém um esquema (colunas de dados). Após anexar um domínio ou um domínio composto a um serviço de dados de referência, mapeie o domínio anexado ou os domínios individuais no domínio composto anexado para as colunas apropriadas em um esquema de serviço de dados de referência. Ao anexar um domínio composto a um serviço de dados de referência, você pode anexar apenas um domínio a um serviço de dados de referência e, em seguida, mapear os domínios individuais no domínio composto para as colunas apropriadas no esquema de serviço de dados de referência.
Cuidado |
---|
O domínio composto anexado a um serviço de dados de referência está disponível na lista suspensa dos domínios ao mapear domínios para colunas no esquema de serviço de dados de referência. Não mapeie o domínio composto para uma coluna no esquema do serviço de dados de referência; mapeie apenas domínios individuais em um domínio composto para as colunas apropriadas no esquema de serviço de dados de referência. Caso contrário, isso resultará em um erro. |
Um esquema de serviço de dados de referência pode ter uma coluna obrigatória que deverá ser mapeada com o domínio apropriado se você optar por usar o serviço de dados de referência. A coluna obrigatória em um esquema de dados de referência é identificada com “(M)” no nome da coluna. Por exemplo, AddressLine é a coluna de esquema obrigatória em Melissa Data – Dados de Endereço e CompanyName é a coluna de esquema obrigatória em Digital Trowel Inc. – Dados de empresas norte-americanas e de profissionais para usuários do SQL.
Neste tópico, criaremos quatro domínios: Linha de endereço, Cidade, Estado e CEP, em um domínio composto, Verificação de Endereço, anexaremos o domínio composto para o serviço de dados de referência de Melissa Data – Dados de Endereço, e mapearemos os domínios individuais no domínio composto para as colunas no esquema de serviço de dados de referência.
Neste tópico
Antes de começar:
Pré-requisitos
Segurança
Mapear o domínio para os dados de referência de Melissa Data
Acompanhamento: Após mapear um domínio para os dados de referência
Antes de começar
Pré-requisitos
Você deve configurar o Data Quality Services (DQS) para usar serviços de dados de referência. Consulte Configurar DQS para usar dados de referência.
Segurança
Permissões
Você deve ter a função dqs_kb_editor no banco de dados DQS_MAIN para mapear domínios para os dados de referência.
[Início]
Mapear domínios para os dados de referência de Melissa Data
Iniciar o Cliente Data Quality. Para obter informações sobre como fazer isso, consulte Executar o aplicativo do cliente do Data Quality.
Na tela inicial do Cliente Data Quality, em Gerenciamento da Base de Dados de Conhecimento, clique em Nova base de dados de conhecimento.
Na tela Nova base de dados de conhecimento, digite um nome para a nova base de dados de conhecimento, clique na atividade Gerenciamento de Domínio e clique em Criar.
Na tela Gerenciamento de Domínio, clique no ícone Criar um domínio para criar um domínio. Crie os quatro domínios a seguir: Linha de Endereço , Cidade, Estado e CEP.
Clique no ícone Criar um domínio composto para criar um domínio composto. Na caixa de diálogo Criar um domínio composto, digite Verificação de Endereço na caixa Nome de Domínio Composto e inclua todos os domínios criados na etapa 3 no domínio composto. Clique em OK.
No painel Domínio no lado esquerdo, selecione o domínio composto clicando em Verificação de Endereço e clique na guia Dados de Referência à direita.
Clique no ícone Procurar.
Caixa de diálogo Catálogo de Provedores de Dados de Referência Online:
Em DataMarket Data Quality Services, selecione a caixa Melissa Data – Verificação de Endereço.
Mapeie as colunas do serviço de dados de referência de Melissa Data - Verificação de Endereço com os domínios apropriados (Linha de Endereço, Cidade, Estado e CEP). Você mapeia as colunas selecionando uma coluna de serviço de dados de referência na coluna Esquema RDS e, depois, selecionando o domínio apropriado na coluna Domínio. Para adicionar mais linhas à tabela, clique no ícone Adicionar Entrada de Esquema.
Clique em OK para salvar as alterações e fechar a caixa de diálogo Catálogo de Provedores de Dados de Referência Online.
Observação Na caixa de diálogo Catálogo de Provedores de Dados de Referência Online, o nó DataMarket Data Quality Services exibe todos os provedores de serviço de dados de referência que você assinou no Windows Azure Marketplace. Se você tiver configurado provedores diretos de serviço de dados de referência online terceirizados no DQS, eles aparecerão em outro nó chamado Provedores Online Diretos Terceirizados (não disponível agora, pois nenhum provedor direto de serviço de dados de referência online terceirizado está configurado no DQS).
Você retornará à guia Dados de Referência. Na área Configurações de Provedor, altere os valores nas seguintes caixas, se necessário:
Limite de Correção Automática: as correções do serviço de dados de referência com nível de confiança acima desses valores de limite serão feitas automaticamente. Insira um valor na notação decimal do valor percentual correspondente. Por exemplo, insira 0,9 para 90%.
Candidatos Sugeridos: número de candidatos sugeridos a serem exibidos pelo serviço de dados de referência.
Confiança Mínima: as sugestões do serviço de dados de referência com nível de confiança inferior a esse valor serão ignoradas. Insira um valor na notação decimal do valor percentual correspondente. Por exemplo, insira 0,6 para 60%.
Clique em Concluir para publicar a base de dados de conhecimento. Uma mensagem de confirmação aparece depois que a base de dados de conhecimento é publicada com êxito.
Você pode usar essa base de dados de conhecimento agora na atividade de limpeza de um projeto de qualidade de dados para padronizar e limpar os endereços americanos na fonte de dados com base no conhecimento fornecido por Melissa Data através do Windows Azure Marketplace.
[Início]
Acompanhamento: Após mapear um domínio para os dados de referência
Crie um projeto de qualidade de dados e execute a atividade de limpeza na fonte de dados que contém endereços americanos, comparando-a com a base de dados de conhecimento criada neste tópico. Consulte Limpar dados usando o conhecimento (externo) dos dados de referência.
[Início]