Lezione 5: Automatizzazione della pulizia e della corrispondenza tramite SSIS
Nella lezione 1 è stata compilata la Knowledge Base Suppliers utilizzata per pulire i dati nella lezione 2 e per individuare corrispondenze di dati nella lezione 3 mediante lo strumento client DQS. In uno scenario realistico, potrebbe essere necessario estrarre i dati da un'origine non supportata da DQS oppure si desidera automatizzare il processo di pulizia e di corrispondenza senza dover utilizzare lo strumento client DQS. In SQL Server Integration Services (SSIS) sono disponibili componenti utilizzabili per l'integrazione dei dati da diverse origini eterogenee e un componente trasformazione DQS Cleansing per richiamare la funzionalità di pulizia esposta da DQS. Attualmente, in DQS non viene esposta la funzionalità di individuazione delle corrispondenze per SSIS, tuttavia, per identificare duplicati nei dati, è possibile utilizzare la trasformazione Raggruppamento fuzzy.
È possibile caricare i dati in MDS tramite la gestione temporanea basata su entità. Quando si crea un'entità in MDS, vengono create automaticamente le tabelle di gestione temporanea e le stored procedure corrispondenti. Ad esempio, una volta creata l'entità Supplier, vengono create automaticamente la tabella stg.supplier_Leaf e la stored procedure stg.udp_Supplier_Leaf. È possibile utilizzare le stored procedure e le tabelle di gestione temporanea per creare, aggiornare ed eliminare membri di entità. In questa lezione vengono creati nuovi membri entità per l'entità Supplier. Per caricare i dati nel server MDS, tramite il pacchetto SSIS vengono innanzitutto caricati i dati nella tabella di gestione temporanea stg.supplier_Leaf e, successivamente, viene attivata la stored procedure associata stg.udp_Supplier_Leaf. Per ulteriori informazioni, vedere Importazione di dati.
In questa lezione vengono effettuate le attività seguenti:
Rimozione di dati fornitore in MDS (se sono già state completate le quattro lezioni precedenti). Tramite il pacchetto SSIS creato durante questa lezione i dati vengono caricati automaticamente in MDS. In precedenza, i dati fornitore puliti e corrispondenti venivano caricati nel server MDS manualmente tramite il client DQS.
Creazione di una vista sottoscrizioni nell'entità Supplier per esporre i dati nell'entità ad altre applicazioni. Tramite questa azione viene creata una vista SQL che verrà verificata utilizzando SQL Server Management Studio. Questa vista non verrà utilizzata in questa versione dell'esercitazione.
Creazione ed esecuzione di un progetto SSIS mediante SQL Server Data Tools. Nel progetto viene utilizzata la trasformazione Data Cleansing per inviare una richiesta di pulizia al server DQS. In DQS non viene ancora esposta la funzionalità di individuazione delle corrispondenze, pertanto per identificare i duplicati si utilizzerà la trasformazione Raggruppamento fuzzy.
Verifica dell'effettiva creazione dei dati in MDS tramite Gestione dati master.
Analisi dei risultati del progetto DQS Cleansing creato dal pacchetto SSIS e, facoltativamente, esecuzione della pulizia interattiva per continuare a compilare la Knowledge Base.
Passaggio successivo
Attività 1 (prerequisito): Rimozione dei dati fornitore in MDS