Associare un dominio o un dominio composito a dati di riferimento
In questo argomento viene descritto come collegare domini/domini compositi in un knowledge base data quality a un servizio dati di riferimento in Azure Marketplace per ottenere informazioni sui dati di riferimento di alta qualità. Ogni servizio dati di riferimento contiene uno schema (colonne di dati). Dopo aver collegato un dominio o un dominio composito a un servizio dati di riferimento, è necessario eseguire il mapping del dominio collegato o i singoli domini all'interno del dominio composito collegato alle colonne appropriate in uno schema del servizio dati di riferimento. Il collegamento di un dominio composito a un servizio dati di riferimento consente di collegare solo un dominio a un servizio dati di riferimento e quindi di eseguire il mapping dei singoli domini all'interno del dominio composito alle colonne appropriate nello schema del servizio dati di riferimento.
Avviso
Il dominio composito collegato a un servizio dati di riferimento è disponibile nell'elenco a discesa dei domini durante il mapping dei domini alle colonne nello schema del servizio dati di riferimento. Non eseguire il mapping del dominio composito a una colonna nello schema del servizio dati di riferimento; è necessario eseguire il mapping solo dei singoli domini all'interno di un dominio composito alle colonne appropriate nello schema del servizio dati di riferimento. In caso contrario, si verificherà un errore.
Uno schema di servizio dati di riferimento può contenere una colonna obbligatoria di cui è necessario eseguire il mapping con il dominio appropriato qualora si scegliesse di utilizzare il servizio dati di riferimento. La colonna obbligatoria in uno schema dati di riferimento viene identificata con "(M)" per il nome della colonna. Ad esempio, AddressLine è la colonna di schema obbligatoria in Melissa Data - Address Data e CompanyName è la colonna di schema obbligatoria in Digital Trowel Inc. - Us companies and professional data for SQL users.
In questo argomento, si creeranno quattro domini: Riga indirizzo, Città, Statoe CAPin un dominio composito, Verifica indirizzo, collegare il dominio composito al servizio dati di riferimento Melissa Data - Controllo indirizzo, quindi eseguire il mapping dei singoli domini all'interno del dominio composito alle colonne appropriate nello schema del servizio dati di riferimento.
Prima di iniziare
Prerequisiti
È necessario aver configurato Data Quality Services (DQS) per l'uso dei servizi dati di riferimento. Vedere Configurare DQS per l'uso di dati di riferimento.
Sicurezza
Autorizzazioni
Per eseguire il mapping dei domini ai dati di riferimento, è necessario disporre del ruolo dqs_kb_editor nel database DQS_MAIN.
Eseguire il mapping dei domini ai dati di riferimento da Melissa Data
Avviare client Data Quality. Per informazioni su questa operazione, vedere Eseguire l'applicazione Data Quality Client.
Nella schermata iniziale Data Quality Client, in Gestione knowledge base, fare clic su Nuovo knowledge base.
Nella schermata Nuova Knowledge Base digitare un nome per la nuova Knowledge Base, fare clic sull'attività Gestione dominio , quindi fare clic su Crea.
Nello schermata Gestione dominio fare clic sull'icona Crea un dominio per creare un dominio. Creare i quattro domini seguenti: Riga indirizzo, Città, Statoe CAP.
Fare clic sull'icona Crea un dominio composito per creare un dominio composito. Nella finestra di dialogo Crea un dominio composito digitare Verifica indirizzo nella casella Nome dominio composito e includervi tutti i domini creati nel passaggio 3. Fare clic su OK.
Nel riquadro Dominio sul lato sinistro selezionare il dominio composito facendo clic su Verifica indirizzo, quindi fare clic sulla scheda Dati di riferimento sul lato destro.
Fare clic sull'icona Sfoglia .
Nella finestra di dialogo Catalogo dei provider di dati di riferimento online :
In DataMarket Data Quality Servicesselezionare la casella Melissa Data - Controllo indirizzo.
Eseguire il mapping delle colonne del servizio dati di riferimento Melissa Data - Controllo indirizzo con i domini appropriati (Riga indirizzo, Città, Stato e CAP). Per eseguire il mapping delle colonne, selezionare una colonna del servizio dati di riferimento nella colonna Schema servizio dati di riferimento , quindi selezionare il dominio appropriato nella colonna Dominio . Per aggiungere più righe nella tabella, fare clic sull'icona Aggiungi voce di schema .
Fare clic su OK per salvare le modifiche e chiudere la finestra di dialogo Catalogo dei provider di dati di riferimento online .
-
Nota
- Nella finestra di dialogo Catalogo dei provider di dati di riferimento online il nodo DataMarket Data Quality Services visualizza tutti i provider di servizi dati di riferimento sottoscritti in Azure Marketplace. Se in DQS sono stati configurati provider del servizio dati di riferimento di terze parti online, essi verranno visualizzati in un altro nodo denominato Provider online diretti di terzi (non disponibile ora poiché in DQS non è stato configurato alcun provider del servizio dati di riferimento di terze parti online).
Si tornerà alla scheda Dati di riferimento . Nell'area Impostazioni provider modificare i valori nelle caselle seguenti, se necessario:
Soglia di correzione automatica: le correzioni del servizio dati di riferimento con livello di confidenza al di sopra di questi valori soglia verranno effettuate automaticamente. Immettere un valore nella notazione decimale del valore percentuale corrispondente. Ad esempio, digitare 0,9 per 90%.
Candidati suggeriti: numero di candidati suggeriti da visualizzare nel servizio dati di riferimento.
Confidenza min: i suggerimenti del servizio dati di riferimento con livello di confidenza al di sotto di questo valore verranno ignorati. Immettere un valore nella notazione decimale del valore percentuale corrispondente. Ad esempio, digitare 0,6 per 60%.
Fare clic su Fine per pubblicare la Knowledge Base. Al termine della pubblicazione della Knowledge Base verrà visualizzato un messaggio di conferma.
È ora possibile usare questa knowledge base per l'attività di pulizia in un progetto data quality per standardizzare e pulire gli indirizzi degli Stati Uniti nei dati di origine in base alle conoscenze fornite da Melissa Data tramite Azure Marketplace.
Completamento: fasi successive all'esecuzione del mapping di un dominio ai dati di riferimento
Creare un progetto Data Quality ed eseguire l'attività di pulizia sui dati di origine che contengono gli indirizzi US confrontandolo con la Knowledge Base creata in questo argomento. Vedere Pulire i dati usando le informazioni di riferimento (esterne).