Criar um domínio composto
Aplica-se a:SQL Server
Este tópico descreve como criar um domínio composto em uma base de dados de conhecimento no Data Quality Services (DQS). Um domínio composto consiste em um ou mais domínios únicos que se aplicam a um único campo de dados. Para obter mais informações sobre domínios compostos, consulte gerenciando um domínio composto.
Há duas maneiras de criar um novo domínio composto. A primeira é durante a etapa Mapa da atividade de descoberta de conhecimento, quando você está no processo de análise de uma amostra de dados para adicionar conhecimento a uma base de dados de conhecimento nova ou existente. A segunda é durante a atividade de gerenciamento de domínio, quando, em vez de alterar um domínio existente, você cria um novo. Para criar um domínio composto, você já deve ter criado pelo menos dois domínios únicos para adicionar ao domínio composto. Somente os domínios únicos que já foram criados e que não foram adicionados a um domínio composto existente estão disponíveis quando você cria um novo domínio composto. Um único domínio não pode ser adicionado a mais de um domínio composto e um domínio composto não pode ser adicionado a outro domínio composto.
Depois de criar um domínio composto, você pode alterar as propriedades do domínio composto, anexar um serviço de dados de referência ao domínio, criar regras entre domínios ou criar relações de valor. Para fazer isso, selecione o domínio composto na lista Domain da página Domain Management e selecione a guia apropriada.
Antes de começar
Pré-requisitos
Para criar um domínio composto, você deve ter criado e aberto uma base de dados de conhecimento e deve ter criado pelo menos dois domínios únicos para adicionar ao domínio composto.
Segurança
Permissões
Você deve ter a função dqs_kb_editor ou dqs_administrator no banco de dados DQS_MAIN para criar um domínio composto.
Criar um domínio composto na atividade de descoberta de conhecimento
Inicie o Data Quality Client. Para obter informações sobre como fazer isso, consulte executar o aplicativo cliente Data Quality.
Na tela inicial do Cliente Data Quality, clique em Abrir base de dados de conhecimento e, em seguida, selecione uma base de dados de conhecimento ou clique em Nova Base de Dados de Conhecimento e insira as propriedades da nova base de dados de conhecimento.
Selecione Descoberta de Conhecimento como a atividade e, em seguida, clique em Criar para criar a nova base de dados de conhecimento ou Abrir para abrir uma base de dados de conhecimento existente.
Na página Mapa , especifique uma conexão com a fonte de dados. Para obter mais informações, consulte Executar descoberta de conhecimento.
Na tabela Mapeamentos, selecione uma coluna de origem na lista pendente para a coluna Coluna de Origem de uma linha vazia. Certifique-se de que a coluna de origem contém domínio composto endereçado por dois domínios únicos existentes. Se não existirem domínios únicos correspondentes, clique no ícone Criar um Domínio.
Na tabela Mapeamentos, selecione uma coluna de origem na lista suspensa para a coluna Coluna de Origem de uma linha vazia. Verifique se a coluna de origem contém partes de domínio compostas das quais são abordadas por dois domínios únicos existentes. Se não existirem domínios únicos correspondentes, clique no ícone Criar um domínio para criá-los. Para obter mais informações, consulte Criar um domínio.
Clique no ícone Criar um Domínio Composto.
Criar um domínio composto na atividade de gerenciamento de domínio
Na home page do cliente Data Quality Services, clique em Abrir base de dados de conhecimento e, em seguida, selecione uma base de dados de conhecimento ou clique em Nova Base de Dados de Conhecimento e insira as propriedades da nova base de dados de conhecimento.
Selecione Gerenciamento de Domínio como a atividade e clique em Criar para criar a nova base de dados de conhecimento ou Abrir para abrir uma base de dados de conhecimento existente.
Verifique se existem dois ou mais domínios únicos exigidos pelo domínio composto. Caso contrário, clique no ícone Criar Domínios e crie-os. Para obter mais informações, consulte Criar um domínio.
Na página Gestão de Domínios, clique no ícone Criar um Domínio Composto acima da lista de domínios.
Insira um nome exclusivo para a base de dados de conhecimento e uma descrição de até 256 caracteres.
Na Lista de Domínios, selecione os domínios que farão parte do domínio composto e clique na seta para a direita para movê-los para a tabela Domínios no Domínio Composto.
Clique OK.
Definir propriedades de domínio composto
Na caixa de diálogo Criar um domínio composto, insira um nome exclusivo para a base de dados de conhecimento e uma descrição de até 256 caracteres.
Na Lista de Domínios, selecione os domínios que farão parte do domínio composto e clique na seta para a direita para movê-los para a tabela Domínios no Domínio Composto. Esta é uma lista de domínios únicos que estão disponíveis para serem adicionados ao domínio composto que você está criando. Apenas os domínios únicos que já foram criados e que não foram adicionados a um domínio composto existente estão disponíveis. Um único domínio não pode ser adicionado a mais de um domínio composto na base de dados de conhecimento e um domínio composto não pode ser adicionado a outro domínio composto.
Clique em Avançado.
Selecione uma das seguintes opções para o Método de Análise :
Dados de referência: Analise os valores do campo de acordo com a forma como os dados são formatados pelo Serviço de Dados de Referência (RDS). O Data Quality Services enviará os valores no domínio composto para o RDS, e o RDS retornará os dados corrigidos e analisados de acordo com o domínio no domínio composto.
Em ordem: Analise os valores do campo de acordo com a ordem dos domínios no domínio composto. O primeiro valor será incluído no primeiro domínio, o segundo valor nos segundos domínios e assim por diante.
Delimitadores: Analise os valores do campo com base no delimitador selecionado nos botões de opção exibidos quando Delimitadores é selecionado. Pode ser tab, ponto e vírgula, vírgula, espaçoou outro. Se selecionar Outros, insira o valor que servirá como delimitador.
Se você selecionou Delimitadores para o método de análise, também poderá selecionar Usar análise baseada em conhecimento. Para obter mais informações, consulte Knowledge-Based Parsing.
Clique em Concluir para concluir a atividade de gerenciamento de domínio, conforme descrito em Encerrar a atividade de gerenciamento de domínio.
Acompanhamento: Depois de criar um domínio composto
Depois de criar um domínio composto, você pode executar outras tarefas de gerenciamento de domínio no domínio, pode executar a descoberta de conhecimento para adicionar conhecimento ao domínio ou pode adicionar uma política de correspondência ao domínio. Para obter mais informações, consulte Executar Descoberta de Conhecimento, Gerir um Domínio, ou Criar uma Política de Correspondência.
Knowledge-Based Análise
Data Quality Services permite-lhe analisar dados com base no conhecimento, não apenas no delimitador ou na ordem. A análise baseada em conhecimento é usada quando dados de origem complexos são mapeados para um domínio composto e você não está usando serviços de dados de referência. Você pode usar a análise baseada em conhecimento para analisar os dados da fonte de dados nos domínios únicos relevantes. Com a análise baseada em conhecimento, o DQS primeiro tentará usar o conhecimento para analisar dados complexos em domínios únicos. Se possível, ele identificará partes da cadeia de caracteres como em um ou mais domínios e analisará a cadeia de caracteres em seus vários domínios. Por exemplo, suponha que você tenha "John B. Doe" como um valor complexo em um campo de nome completo representado por um domínio composto de nome completo. Se o DQS identificar "John" como no domínio First Name e "Doe" como no domínio Last Name, o DQS adicionará "B." ao domínio Middle Name com base no conhecimento do domínio.
Você pode usar a análise baseada em conhecimento somente se também selecionar a análise baseada em delimitador. A análise baseada no conhecimento não substitui a análise do delimitador, mas a aprimora. Somente se não houver conhecimento para fazer isso é que o DQS usará um delimitador para fazer a análise. Em alguns casos, o DQS pode determinar alguma análise por análise baseada em conhecimento e, em seguida, determinar outra análise por análise baseada em delimitador.
A análise baseada em conhecimento pode ser usada quando o domínio composto é composto por domínios de cadeia de caracteres ou quando o domínio composto é composto por uma mistura de diferentes tipos de domínios (int, data, hora, etc.). Se a fonte de dados for composta por diferentes tipos de dados, a análise deve ser feita primeiro para os tipos de dados sem cadeia de caracteres e, em seguida, conforme descrito acima, com base no conhecimento do domínio para o restante dos dados.
Quando você estiver usando a análise baseada em conhecimento e houver menos valores nos dados de origem do que domínios no domínio composto, o DQS colocará um nulo no domínio ausente. Quando houver mais valores nos dados de origem do que domínios no domínio composto, o DQS adicionará os dados extras a uma das colunas. Se dois ou mais domínios incluírem os mesmos valores, a fonte de dados será analisada para o primeiro domínio correspondente.