Attività 2: Test e pubblicazione dei criteri di corrispondenza
In questa attività vengono testati e pubblicati i criteri di corrispondenza Rimuovi fornitori duplicati.
Nella pagina Risultati corrispondenti fare clic su Avvia per testare tutti i criteri. Nel caso in questione, si dispone di una sola regola nei criteri, pertanto i risultati del test della regola e dei criteri devono essere uguali.
Controllare tutti i record corrispondenti e il punteggio di corrispondenza nella casella di riepilogo. Un record con un'icona verde è un duplicato del record pivot che lo precede. Di seguito sono riportati un paio di esempi:
Il record con ID record: 1000005 è una corrispondenza del record ID record: 1000004 con Punteggio: 100%, dal momento che i valori per SupplierID (prerequisito), Supplier Name e ContactEmailAddress columns di entrambi i record sono gli stessi. In DQS la selezione di un record come record pivot per un cluster viene eseguita in modo casuale.
Il record 1000023 è una corrispondenza del record 1000022 con il punteggio di corrispondenza: 93%, dal momento che i valori delle colonne SupplierID (prerequisito) e Supplier Name dei due record sono gli stessi, ma i valori della colonna ContactEmailAddress sono diversi.
Scorrere fino alla fine dell'elenco per visualizzare i due record con ID: 1000051 e 1000052. Il record 1000052 è considerato una corrispondenza con un punteggio di corrispondenza del 91%, dal momento che i valori delle colonne SupplierID e ContactEmailAddress dei due record sono gli stessi, ma i valori della colonna Supplier Name sono diversi.
Fare clic con il pulsante destro del mouse su qualsiasi record corrispondente (con l'icona verde) e scegliere Visualizza dettagli per visualizzare ulteriori dettagli sulla corrispondenza, ad esempio il contributo di ogni campo di valutazione al punteggio complessivo di corrispondenza.
Fare clic su Chiudi per chiudere la finestra di dialogo Dettagli punteggio corrispondente.
Fare clic sulla scheda Risultati corrispondenti nella parte inferiore della pagina. In questa scheda vengono visualizzati dettagli quali il numero di record corrispondenti, il numero di record non corrispondenti, il numero di cluster con record corrispondenti e le dimensioni medie, minime e massime del cluster. Per ulteriori informazioni, vedere Creazione di criteri di corrispondenza. Non è possibile esportare i risultati di questa attività. Si sta definendo solo un criterio di corrispondenza utilizzando i dati di esempio per testare le regole e i criteri nei dati di esempio.
Fare clic su Fine per completare la creazione dei criteri di corrispondenza.
[!NOTA]
Sono stati definiti i criteri di corrispondenza, pertanto non è possibile esportare i risultati in un file di output. Fondamentalmente, è stato utilizzato un file di input di esempio, sono state create regole e sono stati testati criteri e regole nei dati di esempio con l'obiettivo di definire i criteri.
Nella finestra di dialogo SQL Server Data Quality Services fare clic su Pubblica, quindi scegliere OK nella finestra di messaggio. A questo punto, i criteri di corrispondenza definiti vengono pubblicati nella Knowledge Base Suppliers. È possibile utilizzare la Knowledge Base per eseguire il processo di corrispondenza in un file di input per identificare e rimuovere duplicati.
Passaggio successivo
Attività 3: Creazione ed esecuzione di un progetto Data Quality per la corrispondenza