Partilhar via


Lição 2: Limpando dados de fornecedor usando a base de dados de conhecimento de fornecedores

Nesta lição, você limpará os dados do fornecedor em um arquivo do Excel usando os fornecedores base de dados de conhecimento que você criou na primeira lição. A limpeza de dados no DQS inclui um processo assistido por computador que analisa como os dados estão em conformidade com o conhecimento em um base de dados de conhecimento e um processo interativo que permite examinar e modificar os resultados do processo assistido por computador. O recurso de limpeza de dados identifica dados incorretos na fonte de dados e corrige ou sugere correções para os dados incorretos. Também padroniza e enriquece dados de cliente usando valores de domínio, valores principais para sinônimos, regras de domínio, relações baseadas em termos e dados de referência. Você pode aprovar ou rejeitar interativamente as alterações propostas pelo processo auxiliado por computador. Consulte Limpeza de Dados para obter mais detalhes.

O processo auxiliado por computador usa os valores de limite a seguir que você pode configurar usando a opção Configuração na página principal do Cliente DQS.

  • Pontuação mínima para sugestões: A pontuação mínima ou o nível de confiança usado pelo DQS para sugerir a substituição de um valor.

  • Pontuação mínima para correções automáticas: A pontuação mínima ou o nível de confiança usado pelo DQS para corrigir automaticamente um valor.

Consulte Configurar valores de limite para limpeza e correspondência para obter detalhes sobre como definir essas configurações.

Nesta lição, você executará as seguintes tarefas para limpar os dados de entrada usando a base de dados de conhecimento Fornecedores.

  1. Crie um Projeto do Data Quality para Limpeza, selecione a base de dados de conhecimento Fornecedores como a base de dados de conhecimento a ser usada para analisar e limpar os dados de origem em um arquivo do Excel e selecione a atividade Limpeza.

  2. Mapeie as colunas do Excel que você deseja limpar para os domínios do DQS/domínios compostos apropriados na base de dados de conhecimento.

  3. Execute a atividade de limpeza auxiliada por computador. O processo auxiliado por computador exibe informações de qualidade de dados no Cliente do Data Quality que você pode usar para limpar os dados interativamente.

  4. Exiba e gerencie os resultados da atividade de limpeza. Você pode examinar os valores que o processo auxiliado pelo computador considerar corretos, incorretos mas corrigidos, incorretos com uma alteração sugerida ou inválidos. Você pode aprovar ou rejeitar interativamente as alterações, corrigir ou substituir a sugestão do processo auxiliado pelo computador usando o campo Corrigir para.

  5. Exporte os resultados do processo de limpeza para um arquivo do Excel.

  6. Importe os valores do projeto de limpeza para domínios para aumentar o conhecimento no base de dados de conhecimento com novas regras, valores, correções etc...

Próxima etapa

Tarefa 1: Criando um Projeto de Qualidade de Dados