Criar Relações Term-Based
Aplica-se a:SQL Server
Este tópico descreve como criar relações baseadas em termos para um domínio no Data Quality Services (DQS). Uma relação baseada em termos (TBR) permite que você faça uma correção para um termo que faz parte de um valor em um domínio. Ele permite que vários valores que são idênticos, exceto para a grafia de uma parte comum deles, sejam considerados sinônimos idênticos. Por exemplo, você pode configurar uma relação baseada em termos que altere o termo "Inc." para "Incorporado". O termo "Inc." será alterado sempre que aparecer no texto do domínio. As instâncias de "Contoso, Inc." serão alteradas para "Contoso, Incorporated", e os dois valores serão considerados sinónimos exatos.
Para usar relações baseadas em termos, você cria uma lista de pares Valor/Correto Para, como "Inc." e "Incorporado", ou "Sênior" e "Sr.". O uso de uma relação baseada em termos permite alterar um termo em todo o domínio sem definir manualmente valores de domínio individuais como sinônimos. Você pode especificar que um valor seja corrigido mesmo que a descoberta de conhecimento não tenha descoberto esse valor anteriormente. Se uma transformação de relação baseada em termos fizer com que dois valores sejam idênticos, o DQS criará uma relação de sinônimo entre eles (na descoberta de conhecimento), uma relação de correção entre eles (na correção de dados) ou uma correspondência exata (na correspondência).
A transformação de relações baseadas em termos e a transformação de símbolos (em que caracteres especiais são substituídos por um espaço ou um nulo) são ambas feitas em um estágio de pré-processamento antes da análise. Se a análise de domínio composto for solicitada, ela será executada antes das duas transformações, porque a análise do delimitador requer símbolos. Outras operações, como regras de domínio e alterações de valor de domínio, serão executadas após as transformações. Para correspondência, as relações baseadas em termos são aplicadas nos dados de origem antes da atividade de correspondência, independentemente de você executar a limpeza.
Gestão de Relações e Domínios Term-Based
Quando você aplica uma relação baseada em termos no gerenciamento de domínio, o DQS aplicará as alterações nos processos de descoberta, limpeza ou correspondência de conhecimento; no entanto, o DQS não altera o próprio valor do domínio para estar em conformidade com a relação baseada em termos. Em outras palavras, se tu inserires e aceitares uma relação baseada em termos na guia Term-Based Relações da página Gerenciamento de Domínio, a alteração não será feita na guia Valores de Domínio da mesma página. Isso permite que você altere o TBR posteriormente.
Term-Based Relações e Limpeza de Dados
Quando você aplica uma relação baseada em termos em um domínio e, em seguida, executa o processo de limpeza de dados, o DQS aplica as alterações durante a limpeza, mas não aplica as alterações aos termos na base de dados de conhecimento.
Se um valor alterado por uma relação baseada em termos estiver no domínio, mas não for um sinônimo, será mostrado na coluna Corrigir para na guia Corrigido da página Gerenciar e Exibir resultados, com a relação Razão definida como Relação baseada em Termo.
Se um valor alterado por uma relação baseada em termo não estiver no domínio e o DQS encontrar um valor correspondente, o valor será corrigido para ele e aparecerá na guia Corrigido ou na guia Sugerido, com base no nível de confiança. Se não for encontrada nenhuma correspondência, o valor aparecerá sob Novo com uma correção TBR. Isso é feito porque, mesmo que você corrija o TBR, isso não significa que o valor está correto.
Se um valor alterado por uma relação baseada em termo estiver no domínio, mas o valor for Erro/Inválido com correção existente, o valor aparecerá na guia Corrigido com sua correção e o motivo Valor do Domínio.
Se um valor alterado por uma relação baseada em termo estiver no domínio, mas o valor for Erro/Inválido sem correção, o valor aparecerá na guia Inválido com o motivo Valor do Domínio.
Term-Based Relações e Descoberta do Conhecimento
Quando você aplica uma relação baseada em termos e, em seguida, executa o processo de descoberta de conhecimento, qualquer valor que esteja em conformidade com o TBR permanecerá como está e será identificado como um valor correto. Qualquer valor alterado por um TBR será importado como um valor correto e será identificado como sinônimo de um valor que esteja em conformidade com o TBR.
Relações Term-Based e importação de valores purificados para um domínio
Se importar o conhecimento sobre a qualidade dos dados recolhido durante o processo de limpeza para um domínio, um valor alterado por um TBR será importado como um valor correto.
Antes de começar
Pré-requisitos
Para criar relações baseadas em termos, você deve ter um domínio aberto na atividade Gerenciamento de Domínio.
Segurança
Permissões
Você deve ter a função dqs_kb_editor ou dqs_administrator no banco de dados DQS_MAIN para criar relações baseadas em termos.
Criar Relações Term-Based
Inicie o Data Quality Client. Para obter informações sobre como fazer isso, consulte executar o aplicativo cliente Data Quality.
Na tela inicial do Cliente Data Quality, abra ou crie uma base de dados de conhecimento. Selecione Gerenciamento de Domínio como a atividade, e depois clique em Abrir ou Criar. Para obter mais informações, consulte Criar uma Base de Dados de Conhecimento ou Abrir uma Base de Dados de Conhecimento.
Observação
O gerenciamento de domínio é executado em uma página do cliente Data Quality Service que contém cinco guias para operações de gerenciamento de domínio separadas. Não é um processo conduzido por assistentes; qualquer operação de gestão pode ser realizada separadamente.
Na lista de Domínio na página de Gestão de Domínio , selecione o domínio para o qual deseja criar uma regra de domínio ou crie um novo domínio. Se tiver de criar um novo domínio, consulte Criar um domínio.
Clique na guia Term-Based Relações.
Crie relações baseadas em termos da seguinte maneira:
Clique Adicionar Nova Relação para adicionar uma linha à tabela Relações.
Para a coluna Valor da linha adicionada, insira um termo que você deseja alterar sempre que ocorrer em um valor no domínio selecionado.
Observação
Você receberá um erro se o termo existir como um valor inteiro no domínio ou se já existir como um valor de correção no domínio.
Para a coluna Corrigir, insira um termo para o qual pretende alterar o termo na coluna Valor.
Clique Adicionar Novas Relações novamente para adicionar outra relação baseada em termos.
Clique Excluir Relações Selecionadas para excluir uma ou mais linhas selecionadas da tabela Relações. Você pode selecionar várias linhas pressionando o botão Ctrl e clicando em uma linha não selecionada.
Encontre um valor na tabela Relações inserindo um ou mais dígitos na caixa de texto Localizar. As correspondências para a string serão destacadas. Use as setas para cima e para baixo no teclado para mover para diferentes instâncias da "string" na tabela.
Speller: Se um valor na coluna Valor ou Corrigir para estiver sublinhado a vermelho com uma linha ondulada, o Speller sugere uma correção para o valor. Clique com o botão direito do mouse no valor com o sublinhado e selecione um dos valores propostos pelo Speller. Como alternativa, você pode clicar em Adicionar no menu de atalho tp prosseguir com o valor original. Para obter mais informações, consulte Utilizar o Corretor DQS e Definir propriedades do domínio.
Observação
Para usar o Speller, pode ativá-lo na página Propriedades do Domínio ou, se estiver desativado na página Propriedades do Domínio, pode clicar no ícone Ativar/Desativar Speller na página RelaçõesTerm-Based para ativá-lo nesta página.
Clique em Aplicar Alterações para aplicar as relações baseadas em termos ao domínio.
Clique em Concluir para concluir a atividade de gerenciamento de domínio, conforme descrito em Encerrar a atividade de gerenciamento de domínio.
Acompanhamento: Depois de criar relações Term-Based
Depois de criar relações baseadas em termos, você pode executar outras tarefas de gerenciamento de domínio no domínio, pode executar a descoberta de conhecimento para adicionar conhecimento ao domínio ou pode adicionar uma política de correspondência ao domínio. Para obter mais informações, consulte Descoberta de Conhecimento, Gerir um Domínio, ou Criar uma Política de Correspondência.