Partilhar via


Lição 5: Automatizando a limpeza e a correspondência usando o SSIS

Na Lição 1, você criou a base de dados de conhecimento Fornecedores e a usou para limpar dados na Lição 2 e corresponder dados na Lição 3 usando a ferramenta Cliente DQS. Em um cenário do mundo real, talvez seja necessário efetuar pull de dados de uma fonte à qual o DQS não dá suporte ou você deseja automatizar o processo de limpeza e correspondência sem precisar usar a ferramenta cliente DQS . SQL Server Integration Services (SSIS) tem componentes que você pode usar para integrar dados de várias fontes heterogêneas e um componente DQS Cleansing Transform para invocar a funcionalidade de limpeza exposta pelo DQS. Atualmente, o DQS não expõe a funcionalidade correspondente para uso do SSIS, mas você pode usar a Transformação agrupamento difuso para identificar duplicatas nos dados.

Você pode carregar dados no MDS usando o recurso preparo baseado em entidade. Quando você cria uma entidade no MDS, os procedimentos armazenados e as tabelas de preparo correspondentes são criados automaticamente. Por exemplo, quando você criou a entidade Supplier, a tabela stg.supplier_Leaf e o procedimento armazenado stg.udp_Supplier_Leaf foram criados automaticamente. Use os procedimentos e as tabelas de preparo para criar, atualizar e excluir membros de entidade. Nesta lição, você criará novos membros de entidade para a Entidade Fornecedor. Para carregar dados no servidor MDS, o pacote SSIS primeiro carrega os dados na tabela de preparação stg.supplier_Leaf e, em seguida, dispara o procedimento armazenado stg.udp_Supplier_Leaf associado. Consulte Importando dados para obter mais detalhes.

Nesta lição, você executará as seguintes tarefas:

  1. Remover dados do fornecedor no MDS (se você tiver feito as quatro lições anteriores). O pacote SSIS criado nessa lição carrega automaticamente os dados no MDS. Antigamente, você carregava manualmente os dados limpos e correspondentes do fornecedor no servidor MDS usando o Cliente DQS.

  2. Criar uma exibição de assinatura na entidade Fornecedor para expor os dados da entidade a outros aplicativos. Essa ação cria uma exibição SQL que você verificará usando o SQL Server Management Studio. Você não utilizará essa exibição nesta versão do tutorial.

  3. Crie e execute um projeto do SSIS usando SQL Server Data Tools. O projeto usa a transformação Limpeza de Dados para enviar uma solicitação de limpeza para o servidor DQS. O DQS ainda não expõe a funcionalidade correspondente, portanto, você usará a transformação Agrupamento Difuso para identificar duplicatas.

  4. Verificar se os dados foram criados no MDS usando o Master Data Manager.

  5. Examinar os resultados do projeto de limpeza DQS criado pelo pacote SSIS e, se desejar, executar a limpeza interativa para criar a base de dados de conhecimento posteriormente.

Próxima etapa

Tarefa 1 (pré-requisito): Removendo os dados do fornecedor no MDS