Progetti Data Quality (DQS)
Un progetto data quality in Data Quality Services (DQS) è un mezzo per usare un knowledge base per migliorare la qualità dei dati di origine eseguendo attività di pulizia dei dati e corrispondenza dei dati e quindi esportando i dati risultanti in un database SQL Server o in un file di .csv. È possibile creare un progetto di qualità dei dati come progetto di pulizia o come progetto di corrispondenza per eseguire le rispettive attività. È possibile eseguire progetti di pulizia e di individuazione delle corrispondenze utilizzando la stessa Knowledge Base, poiché le informazioni per la pulizia e per l'individuazione di corrispondenze possono essere inserite all'interno della stessa Knowledge Base.
Un progetto di qualità dei dati offre i vantaggi seguenti:
Consente di eseguire la pulizia dei dati sui dati di origine utilizzando le informazioni in una Knowledge Base DQS.
Consente di eseguire l'individuazione delle corrispondenze sui dati di origine utilizzando i criteri di corrispondenza in una Knowledge Base.
Fornisce una procedura guidata per supportare le attività di pulizia e individuazione delle corrispondenze e consente di esportare i dati selezionati in un database SQL Server o in un file csv. L'amministratore dei dati può utilizzare il progetto di qualità dei dati per eseguire e controllare i passaggi di pulizia e di individuazione delle corrispondenze sia computerizzati che interattivi.
Progetto Data Quality: attività di pulizia dei dati
I progetti Data Quality di pulizia consentono di pulire i dati di origine in base a una Knowledge Base. L'attività di pulizia dei dati in DQS è un processo in due passaggi:
Un processo computerizzato di pulizia dei dati tramite cui vengono analizzati i dati di origine in base alle informazioni incluse nella Knowledge Base e vengono proposte modifiche. I dati elaborati vengono suddivisi da DQS in categorie (suggerito, nuovo, non valido, con correzione e corretto), quindi vengono presentati all'utente per ulteriore elaborazione.
Quando il processo di pulizia è interattivo , l'amministratore dei dati può approvare, rifiutare o modificare i dati proposti dal processo di pulizia computerizzato.
Per informazioni dettagliate sull'attività di pulizia in un progetto di qualità dei dati, vedere Data Cleansing.
Progetto Data Quality: attività di individuazione delle corrispondenze
Un progetto Data Quality di corrispondenza tra dati consente di eseguire l'attività di individuazione di corrispondenze in base ai criteri di corrispondenza in una Knowledge Base per impedire la duplicazione dei dati mediante l'identificazione di corrispondenze esatte e approssimative e permettendo quindi la rimozione dei dati duplicati. Si consiglia di pulire i dati prima di eseguire su questi l'individuazione di corrispondenze. A tale scopo, procedere nel seguente modo:
Creare un progetto Data Quality, selezionare l'attività Pulizia , completare l'attività di pulizia sui dati di origine, quindi esportarli in una tabella di un database di SQL Server.
Creare un altro progetto Data Quality utilizzando una Knowledge Base che contiene criteri di corrispondenza, selezionare l'attività Corrispondenza , quindi nella pagina Mappa , selezionare il database e la tabella dove sono stati esportati i dati puliti nel passaggio 1.
Completare l'attività di individuazione delle corrispondenze sui dati puliti.
Per informazioni dettagliate sull'attività di individuazione delle corrispondenze in un progetto Data Quality, vedere Data Matching.
Profiling di dati e notifiche
Durante l'esecuzione delle attività di pulizia e corrispondenza in un progetto Data Quality, è possibile ottenere statistiche e informazioni in tempo reale sui dati elaborati da DQS. Il profiling dati consente di valutare l'efficacia dei processi di pulizia e di corrispondenza nonché l'entità del miglioramento dei dati grazie alla pulizia o all'individuazione delle corrispondenze. Il profiling DQS fornisce due dimensioni della qualità dei dati: completezza (l'entità della presenza dei dati) e accuratezza (la misura entro cui i dati possono essere utilizzati per gli scopi previsti). Inoltre, in base alle informazioni sul profiling dei dati, vengono presentate notifiche riguardanti azioni che possono essere intraprese per migliorare la pulizia dei dati e le operazioni di individuazione delle corrispondenze. Per informazioni dettagliate sul profiling dei dati e sulle notifiche, vedere Data Profiling and Notifications in DQS.
Attività correlate
Descrizione dell'attività | Argomento |
---|---|
Viene descritto come creare un progetto Data Quality. | Creare un progetto Data Quality |
Viene descritto come gestire (aprire, sbloccare, rinominare ed eliminare) un progetto Data Quality. | Gestione di un progetto Data Quality (apertura, sblocco, ridenominazione ed eliminazione) |
Viene descritto come aprire un progetto di Integration Services in Data Quality Client. | Apertura di progetti di Integration Services nel client Data Quality |