Lezione 2: Pulizia dei dati fornitore mediante la Knowledge Base Suppliers
In questa lezione vengono puliti i dati fornitore in un file di Excel utilizzando la Knowledge Base Suppliers creata nella prima lezione. Nella pulizia dei dati in DQS sono inclusi un processo computerizzato tramite cui viene analizzata la conformità dei dati alle informazioni in una Knowledge Base e un processo interattivo che consente all'utente di rivedere e modificare i risultati del processo computerizzato. Tramite la funzionalità di pulizia dei dati vengono identificati i dati errati nell'origine dati e, successivamente, vengono corretti o vengono forniti suggerimenti di correzione. Vengono inoltre standardizzati e arricchiti i dati dei clienti utilizzando i valori di dominio, i valori iniziali per sinonimi, le regole di dominio, le relazioni basate su termini e i dati di riferimento. È possibile approvare o rifiutare in modo interattivo le modifiche proposte dal processo computerizzato. Per ulteriori informazioni, vedere Pulizia dei dati.
Nel processo computerizzato vengono utilizzati i seguenti valori soglia che è possibile configurare utilizzando l'apposita opzione nella pagina principale del client DQS.
Punteggio minimo per suggerimenti: punteggio minimo o livello di probabilità utilizzato da DQS per suggerire sostituzioni per un valore.
Punteggio minimo per correzioni automatiche: punteggio minimo o livello di probabilità utilizzato da DQS per correggere automaticamente un valore.
Per informazioni dettagliate su come configurare queste impostazioni, vedere Configurazione dei valori soglia per le attività di pulizia e di individuazione delle corrispondenze.
In questa lezione vengono effettuate le attività seguenti per pulire i dati di input utilizzando la Knowledge Base Suppliers.
Creare un progetto Data Quality per la pulizia, selezionare la Knowledge Base Suppliers come quella da utilizzare per analizzare e pulire i dati di origine in un file di Excel e selezionare l'attività di pulizia.
Eseguire il mapping delle colonne di Excel che si desidera pulire ai domini DQS singoli/composti appropriati nella Knowledge Base.
Eseguire l'attività di pulizia computerizzata. Tramite il processo computerizzato vengono visualizzate informazioni sulla qualità dei dati nel client Data Quality che possono essere utilizzate per pulire i dati in modo interattivo.
Visualizzare e gestire i risultati dell'attività di pulizia. È possibile esaminare i valori rilevati dal processo computerizzato come corretti, errati ma a cui è stata apportata una correzione, errati con un suggerimento di modifica o non validi. È possibile approvare o rifiutare in modo interattivo le modifiche correggendo o eseguendo l'override dei suggerimenti forniti dal processo computerizzato mediante il campo Correggi in.
Esportare i risultati dal processo di pulizia in un file di Excel.
Importare i valori dal progetto di pulizia nei domini per ampliare le informazioni nella Knowledge Base con nuovi valori, regole, correzioni e così via