Attività 1: Definizione di criteri di corrispondenza
In questa attività vengono creati criteri di corrispondenza in cui è contenuta una regola. Alla regola è associato un prerequisito, Supplier ID, tramite cui viene indicato che gli ID dei fornitori devono corrispondere prima di utilizzare gli altri domini nella regola. Nella regola vengono utilizzati altri due domini: Supplier Name con il valore Somiglianza impostato su 70% e Contact Email con il valore Somiglianza impostato su 30%.
Nella pagina principale del client DQS fare clic sulla freccia a destra accanto alla Knowledge Base Suppliers e selezionare Criteri di corrispondenza.
Nella pagina Mappa selezionare File di Excel per Origine dati.
Fare clic su Sfoglia, verificare che il filtro sia impostato su Cartella di lavoro di Excel e selezionare il file Cleansed Supplier List.xls esportato dopo aver eseguito l'attività di pulizia.
[!NOTA]
Al termine di questa attività, non è possibile esportare i risultati poiché questa attività è mirata principalmente alla definizione di criteri di corrispondenza. Verrà creato un progetto Data Quality per l'attività di corrispondenza che verrà eseguito per rimuovere i duplicati dall'elenco di fornitori utilizzando questi criteri di corrispondenza illustrati nella lezione successiva.
Eseguire il mapping della colonna SupplierID al dominio Supplier ID, della colonna Supplier Name al dominio Supplier Name e della colonna ContactEmailAddress al dominio Contact Email. È sufficiente eseguire il mapping delle colonne di origine ai domini che si desidera utilizzare per la definizione dei criteri di corrispondenza. In questo caso, si stanno rendendo disponibili i domini Supplier ID, Supplier Name e Contact Email per l'attività relativa ai criteri di corrispondenza.
Fare clic su Avanti per passare alla pagina Criteri di corrispondenza in cui si definiranno i criteri di corrispondenza in cui è contenuta una regola.
Fare clic sul pulsante Creare regola di corrispondenza nella barra degli strumenti per creare una regola nei criteri.
Nel riquadro Dettagli regola a destra immettere Rimuovi fornitori duplicati per Nome regola.
Fare clic su Aggiungi nuovo elemento di dominio nella barra degli strumenti nel riquadro destro.
Selezionare Supplier ID come dominio e la casella di controllo Prerequisito. Si noti che l'opzione Somiglianza viene impostata automaticamente su Esatta. Impostando Supplier ID come Prerequisito, viene specificato che tramite i valori per questo campo nei due record deve essere restituita una corrispondenza del 100% e che, in caso contrario, i record non devono essere considerati corrispondenti e le altre clausole nella regola devono essere ignorate.
Fare di nuovo clic su Aggiungi nuovo elemento di dominio nella barra degli strumenti.
Selezionare il dominio Supplier Name, quindi Simile per Somiglianza e digitare 70 come Peso. In questo caso, si specifica che i nomi dei fornitori non devono essere identici, ma possono essere simili per i record che devono essere considerati corrispondenti. Tramite il peso viene indicato il contributo del punteggio di questo campo al punteggio di corrispondenza complessivo.
Ripetere i due passaggi precedenti per aggiungere il dominio Contact Email con 30 come Peso.
Si noti che il punteggio di corrispondenza minimo è impostato su 80%, vale a dire il valore visualizzato nella scheda Generale della pagina Configurazione di Amministrazione DQS. Questo punteggio può essere aumentato oltre questo valore soglia solo qui.
Si noti che l'opzione Cluster sovrapposti è selezionata. Con questa opzione, un record può essere visualizzato in più cluster. Se l'impostazione viene modificata su Cluster non sovrapposti, i cluster che presentano record comuni vengono combinati in uno unico.
Il pulsante Avvia in questa pagina consente di testare separatamente ogni regola dei criteri, mentre il pulsante Avvia nella pagina successiva permette di testare tutti i criteri (tutte le regole dei criteri).
Fare clic su Avanti per passare alla pagina Risultati corrispondenza.
Passaggio successivo
Attività 2: Test e pubblicazione dei criteri di corrispondenza