Conceitos de Serviços de Qualidade de Dados
Aplica-se a:SQL Server
Este tópico fornece um breve resumo dos conceitos do Data Quality Services (DQS) em gerenciamento de conhecimento, projetos de qualidade de dados e administração de qualidade de dados.
Conceitos de Gestão do Conhecimento
A base de conhecimento do DQS é um repositório de metadados criado pelo administrador de dados ou profissional de TI para uso na melhoria da qualidade dos dados por meio da limpeza e correspondência de dados. O gerenciamento de conhecimento do DQS inclui os processos usados para criar e gerenciar a base de conhecimento, tanto de forma assistida por computador quanto interativamente.
Descoberta de Conhecimento
A descoberta de conhecimento é um processo assistido por computador que analisa amostras dos dados da sua organização para criar conhecimento sobre os dados. Depois de obter os resultados da análise, pode validar e aprimorar o conhecimento, e depois aplicá-lo para realizar a limpeza, reconciliação e perfis de dados. Para obter mais informações, consulte Bases de conhecimento e domínios do DQS.
Gestão de Domínio
O processo de gerenciamento de domínio permite alterar ou aumentar o conhecimento gerado pelo processo de descoberta de conhecimento. Você pode editar, atualizar e revisar o conhecimento de forma interativa em uma base de dados de conhecimento. Uma base de dados de conhecimento consiste em domínios de dados que contêm valores de domínio e seu status, regras de domínio, relações baseadas em termos e dados de referência. No gerenciamento de domínio, você pode alterar propriedades de domínio, anexar dados de referência a um domínio, gerenciar regras de domínio, gerenciar valores de domínio e inserir relações de dados e criar, excluir, importar ou exportar domínios. Você também pode usar domínios compostos que agregam mais de um único domínio. Para obter mais informações, consulte Bases de conhecimento e domínios do DQS.
Política de Correspondência
Uma política de correspondência contém as regras de correspondência usadas para executar a deduplicação de dados. O processo de política de correspondência permite criar regras de correspondência, ajustá-las com base em resultados correspondentes e dados de criação de perfil e adicionar a política à base de conhecimento. Para obter mais informações, consulte de correspondência de dados.
Serviços de Dados de Referência
Você pode usar dados de referência para validar, corrigir e enriquecer seus dados, aproveitando os serviços de empresas que garantem a qualidade de seus dados de referência. Você pode usar os serviços do Azure Marketplace para se conectar a provedores de dados de referência ou pode usar uma conexão direta com um provedor. Para obter mais informações, consulte Reference Data Services no DQS.
Para obter mais informações sobre o gerenciamento de conhecimento no DQS, consulte Bases de conhecimento e domínios do DQS.
Conceitos de projeto de qualidade de dados
O administrador de dados executa operações de qualidade de dados (limpeza e correspondência) usando um projeto de qualidade de dados no aplicativo Cliente Data Quality.
Limpeza de Dados
A limpeza de dados no DQS é realizada com base no conhecimento numa base de conhecimento do DQS. A limpeza de dados no DQS é um processo de duas etapas:
Limpeza assistida por computador: O DQS usa o conhecimento na base de dados de conhecimento selecionada para o projeto de limpeza para propor correções/sugestões para os valores em uma fonte de dados.
Limpeza Interativa: O administrador de dados pode executar o processo de limpeza interativo para alterar ou aumentar as correções de dados que foram propostas pelo processo de limpeza de dados assistido por computador. O administrador de dados faz isso usando níveis de confiança e estatísticas identificadas pelo processo de limpeza de dados ou inserindo manualmente suas próprias alterações no projeto.
Depois de limpar os dados, o administrador de dados pode exportar os dados processados para um banco de dados do SQL Server, .csvou um arquivo do Excel. Para obter mais informações, consulte Limpeza de Dados.
Correspondência de Dados
O processo de correspondência permite que o administrador de dados compare dados para que dados semelhantes, mas ligeiramente diferentes, possam ser alinhados por meio de um processo de desduplicação. O DQS executa a desduplicação com base nas regras de correspondência contidas na base de conhecimento; O administrador de dados especifica parâmetros para o processo de correspondência de dentro de um projeto de qualidade de dados. Para obter mais informações, consulte correspondência de dados .
Criação de perfis e notificações
O perfilamento de dados fornece aos administradores de dados estatísticas em tempo real e informações sobre os dados que estão a ser processados pelo DQS para as atividades de limpeza ou correspondência de dados durante a execução de um projeto de qualidade de dados. O perfil de dados ajuda a avaliar a eficácia das atividades de limpeza e conciliação num projeto de melhoria da qualidade dos dados, e as notificações ajudam o utilizador com ações que podem ser tomadas para melhorar as atividades de limpeza e conciliação de dados. Para obter mais informações, consulte Perfilagem de Dados e Notificações no DQS.
Para obter mais informações sobre projetos de qualidade de dados no DQS, consulte Data Quality Projects (DQS).
Conceitos de Administração de Qualidade de Dados
Um administrador do DQS pode executar várias tarefas administrativas usando o aplicativo Cliente Data Quality.
Monitorização de Atividades
O monitoramento de atividades exibe o status e o estado de cada atividade executada dentro de um intervalo de dados, fornece dados para cada atividade e permite que os administradores do DQS controlem uma atividade. Para obter mais informações, consulte Monitor DQS Activities.
Configuração
A opção Configuração permite:
Defina as configurações do serviço de dados de referência. Para obter mais informações, consulte Configurar o DQS para usar dados de referência.
Defina os valores limite para os processos de limpeza e comparação. Para obter mais informações, consulte Configurar valores de limite para limpeza e correspondência.
Ativar/desativar notificações de criação de perfil. Para obter mais informações, consulte Habilitar ou desabilitar notificações de criação de perfil no DQS.
Configure os níveis de severidade para os arquivos de log do DQS no nível baseado em atividade ou no nível mais avançado baseado em módulo. Para obter mais informações, consulte Configurar níveis de severidade para ficheiros de log DQS.
Segurança DQS
Você usa funções dentro do mecanismo de segurança do SQL Server para tornar o DQS seguro. Há três funções DQS que determinam o nível de acesso para um usuário no aplicativo Cliente Data Quality: dqs_administrator, dqs_kb_editor e dqs_kb_operator. Não é possível conceder funções aos usuários usando o aplicativo Cliente Data Quality; isso é feito usando o SQL Server Management Studio. Para obter mais informações, consulte DQS Security.
Para obter mais informações sobre a administração do DQS, consulte DQS Administration.