Definir propriedades do domínio
Aplica-se a:SQL Server
Este tópico descreve como definir propriedades de domínio no Data Quality Services (DQS).
Antes de começar
Pré-requisitos
Para definir propriedades para um domínio, você deve ter criado uma base de dados de conhecimento e um domínio.
Segurança
Permissões
Você deve ter a função dqs_kb_editor ou dqs_administrator no banco de dados DQS_MAIN para definir propriedades em um domínio.
Definir propriedades do domínio
Defina propriedades em um domínio existente abrindo uma base de dados de conhecimento na atividade Gerenciamento de Domínio (consulte Abrir uma Base de Dados de Conhecimento) e selecionando o domínio apropriado na lista Domínio. A página Propriedades do Domínio será exibida por padrão.
Defina as propriedades em um novo domínio depois de criá-lo, conforme descrito em Criar um domínio.
Clique em Concluir para concluir a atividade de gerenciamento de domínio, conforme descrito em Encerrar a atividade de gerenciamento de domínio.
Acompanhamento: Depois de definir as propriedades do domínio
Depois de definir as propriedades do domínio, você pode executar outras tarefas de gerenciamento de domínio no domínio, pode executar a descoberta de conhecimento para adicionar conhecimento ao domínio ou pode adicionar uma política de correspondência ao domínio. Para obter mais informações, consulte Executar Descoberta de Conhecimento, Gerir um Domínioou Criar uma Política de Correspondência.
Propriedades do Domínio
Nome de Domínio e Descrição
Uma vez criado um domínio, o nome de domínio ou a descrição podem ser alterados. O nome de domínio deve ser exclusivo para a base de dados de conhecimento. A descrição pode ter até 256 caracteres.
Tipo de dados
Ao criar o domínio, selecione um dos seguintes tipos de dados para os valores no domínio: String (o padrão), Data, Integerou Decimal. Depois de criar o domínio, você pode exibir o tipo de dados, mas não pode alterá-lo. O tipo de dados selecionado para um domínio define o tipo de dados de origem que podem ser mapeados para o domínio. Para obter informações sobre tipos de dados com suporte para cada um dos quatro tipos de dados de domínio no DQS, consulte Supported SQL Server and SSIS Data Types for DQS Domains.
Usar valores orientadores
Marque esta caixa de seleção para especificar que o valor principal em um grupo de sinônimos será exibido em vez de um valor que seja sinônimo dele. Desmarque Usar Valores Principais para especificar que cada valor sinónimo é gerado na sua forma correta ou corrigida e não é substituído pelo valor principal do seu grupo.
Normalizar cadeia de caracteres
Se o tipo de dados for String, clique para ignorar os caracteres especiais nos dados de origem para o processamento da qualidade dos dados pelo DQS. O DQS substitui internamente os caracteres especiais por um nulo ou um espaço quando os dados são carregados no domínio. Dois pontos, hífen, ponto, aspas duplas ou ponto-e-vírgula são substituídos por um espaço. Uma única citação é substituída por uma nula. O uso do null une as duas partes da cadeia de caracteres.
Ignorar caracteres especiais em um valor de cadeia de caracteres pode aumentar a precisão da correspondência. A pontuação de semelhança entre duas cadeias de caracteres pode ser aumentada substituindo caracteres especiais por um nulo ou um espaço. Os sinais de pontuação ou outros símbolos podem ser facilmente diferentes em cadeias de caracteres diferentes. A substituição de caracteres especiais internamente pode permitir que a pontuação ultrapasse o limite mínimo de correspondência no DQS, fazendo com que duas cadeias sejam consideradas coincidências quando não o teriam sido de outra forma. No entanto, optar por ignorar caracteres especiais pode depender do tipo de dados em que está a ser feita a correspondência. Por exemplo, quando você está trabalhando com dados no sistema inglês de medição, ignorar aspas duplas e aspas simples nos dados do produto pode resultar em falsos positivos se uma aspa dupla representar uma polegada e uma única cotação representar um pé.
A normalização é realizada quando os dados são carregados e indexados nos estágios de processamento de dados de descoberta, política de correspondência, projeto de correspondência e atividades de limpeza do projeto. Se habilitada, a normalização e a transformação das relações baseadas em termos são feitas em um estágio de pré-processamento antes da análise. Eles são executados em cada domínio antes de serem aplicados quaisquer algoritmos que computem a semelhança entre cadeias de caracteres. Se a análise de domínio composto for solicitada, ela será executada antes da normalização e da transformação de relações baseadas em termos, porque a análise do delimitador requer símbolos. Outras operações, como regras de domínio e alterações de valor de domínio, serão executadas após as transformações. Os dados resultantes não são alterados pela substituição interna de caracteres especiais no DQS.
Formatar a saída para
Selecione a formatação que será aplicada quando os valores de dados no domínio forem produzidos. A formatação é específica para o tipo de dados selecionado, conforme mostrado na lista a seguir. Selecionar Nenhum significa que nenhum dos formatos na lista será aplicado.
Para um valor de cadeia de caracteres, pode-se especificar que a cadeia de caracteres seja apresentada em maiúsculas, minúsculas ou com a primeira letra maiúscula.
Para um valor de data, você pode especificar o formato do dia, mês e ano.
Para um valor inteiro, você pode especificar o tipo de máscara de formato a ser aplicada.
Para um valor decimal, você pode especificar a precisão e o tipo de máscara de formato a ser aplicada.
Idioma
Se o tipo de dados for String, selecione o idioma ao qual deseja associar o domínio para a operação do corretor ortográfico. Esta seleção só se aplica ao corretor ortográfico, porque os resultados do ortógrafo dependem do idioma em uso. A seleção só se aplica a um único domínio com um tipo de dados é string. A propriedade language não é relevante para domínios compostos. O idioma para cada parte de um domínio composto é determinado pelo domínio único relevante.
O inglês é o idioma padrão. Definir a propriedade de Idioma como Outros desativa o Speller para o domínio.
Dica
Se o teu idioma não estiver listado na lista suspensa Language, deverás selecionar Outros. Isso garante que o DQS limpe e elimine duplicatas para os dados de idioma não listados com base no conhecimento disponível (regras de domínio, valores de domínio, TBRs, regra de correspondência) no domínio.
Ativar o Verificador Ortográfico
Se o tipo de dados for String, clique para ativar o DQS Speller no domínio. O Speller só funciona em domínios com um tipo de dados string. A caixa de verificação Ativar Verificador Ortográfico habilita o verificador ortográfico apenas para o único domínio associado à caixa de verificação. A caixa de seleção não se aplica a um domínio composto.
O Speller propõe correções de sintaxe e validação para valores no domínio. Para obter mais informações, veja Utilize o Verificador Ortográfico DQS.
Desativar algoritmos de erro de sintaxe
Se o tipo de dados for String, selecione para especificar que os erros de sintaxe não serão identificados pelo DQS no domínio durante a limpeza. Marque essa caixa de seleção quando for irrelevante identificar erros de sintaxe para esse domínio. Por exemplo, identificar erros de sintaxe pode não ser importante para um número de série. Esse controle só está disponível para o tipo de dados de cadeia de caracteres. O DQS não verificará se há erros de sintaxe em tipos de dados que não sejam de cadeia de caracteres.