Een overeenkomend beleid maken
van toepassing op:SQL Server-
In dit onderwerp wordt beschreven hoe u een overeenkomend beleid bouwt in een Knowledge Base in DQS (Data Quality Services). U bereidt zich voor op het matching proces in DQS door de activiteit Matchingbeleid uit te voeren op voorbeeldgegevens. In deze activiteit maakt en test u een of meer overeenkomende regels in het beleid en publiceert u vervolgens de Knowledge Base om de overeenkomende regels openbaar beschikbaar te maken voor gebruik. Er kan slechts één overeenkomend beleid in een knowledge base zijn, maar dat beleid kan meerdere overeenkomende regels bevatten.
Het maken van overeenkomend beleid wordt uitgevoerd in drie fasen: een toewijzingsproces waarin u de gegevensbron identificeert en domeinen toewijst aan kolommen, een overeenkomend beleidsproces waarin u een of meer overeenkomende regels maakt en elke overeenkomende regel afzonderlijk test, en een proces met overeenkomende resultaten waarin u alle overeenkomende regels samen uitvoert, en indien tevreden met deze regels, voeg het beleid toe aan de Knowledge Base. Elk van deze processen wordt uitgevoerd op een afzonderlijke pagina van de wizard Overeenkomend Beleid, zodat u tussen verschillende pagina's kunt navigeren. U kunt het proces opnieuw uitvoeren, een specifiek overeenkomend beleidsproces sluiten en terugkeren naar dezelfde fase van het proces. Nadat u alle regels hebt getest, kunt u desgewenst terugkeren naar de pagina overeenkomend beleid, een afzonderlijke regel aanpassen, deze afzonderlijk testen en vervolgens terugkeren naar de pagina Overeenkomende resultaten om alle regels opnieuw uit te voeren. DQS biedt u statistieken over de brongegevens, de overeenkomende regels en de overeenkomende resultaten waarmee u weloverwogen beslissingen kunt nemen over het overeenkomende beleid, zodat u deze kunt verfijnen.
Voordat u begint
Voorwaarden
Microsoft Excel moet worden geïnstalleerd op de computer van de client voor gegevenskwaliteit als de brongegevens zich in een Excel-bestand bevinden. Anders kunt u het Excel-bestand niet selecteren in de koppelingsfase. De bestanden die door Microsoft Excel zijn gemaakt, kunnen een uitbreiding hebben van .xlsx, .xlsof .csv. Als de 64-bits versie van Excel wordt gebruikt, worden alleen Excel 2003-bestanden (.xls) ondersteund; Excel 2007- of 2010-bestanden (.xlsx) worden niet ondersteund. Als u een 64-bits versie van Excel 2007 of 2010 gebruikt, slaat u het bestand op als een .xls-bestand of een .csv-bestand of installeert u in plaats daarvan een 32-bits versie van Excel.
Veiligheid
Machtigingen
U moet de dqs_kb_editor of de rol dqs_administrator in de DQS_MAIN-database hebben om een overeenkomend beleid te maken.
Hoe overeenkomende regelparameters in te stellen
Het maken van een overeenkomende regel is een iteratief proces waarin u de factoren invoert die worden gebruikt om te bepalen of de ene record overeenkomt met een andere record. U kunt voorwaarden invoeren voor elk domein in een tabel. Wanneer DQS overeenkomsten uitvoert op twee records, worden de waarden in de velden vergeleken die zijn toegewezen aan de domeinen die zijn opgenomen in de overeenkomende regel. DQS analyseert de waarden in elk veld in de regel en gebruikt vervolgens de factoren die in de regel voor elk domein zijn ingevoerd om een uiteindelijke overeenkomende score te berekenen. Als de overeenkomstscore voor de twee vergeleken records groter is dan de minimale overeenkomstscore, worden de twee velden als overeenkomend beschouwd.
De factoren die u invoert in een overeenkomende regel zijn onder andere:
Gewicht: Voer voor elk domein in de regel een numeriek gewicht in dat bepaalt hoe de overeenkomende analyse voor het domein wordt vergeleken met dat voor elk ander domein in de regel. Het gewicht geeft de bijdrage van de score van het veld aan de algehele overeenkomende score tussen twee records. De berekende scores die aan elk bronveld zijn toegewezen, worden opgeteld voor een samengestelde overeenkomende score voor de twee records. Voor elk veld dat geen vereiste is (met een overeenkomst van exact of vergelijkbaar), stelt u het gewicht tussen 10 en 100 in. De som van de gewichten van de domeinen die geen vereisten zijn, moet gelijk zijn aan 100. Als de waarde een vereiste is, wordt het gewicht ingesteld op 0 en kan het niet worden gewijzigd.
Overeenkomst van Exact: selecteer Exacte als de waarden in hetzelfde veld van twee verschillende records identiek moeten zijn voor de waarden die als overeenkomst moeten worden beschouwd. Indien identiek, wordt de overeenkomende score voor dat domein ingesteld op '100'. DQS gebruikt die score en de scores voor de andere domeinen in de regel om de cumulatieve overeenkomende score te bepalen. Als deze niet identiek is, wordt de overeenkomende score voor dat domein ingesteld op '0' en wordt de verwerking van de regel voortgezet naar de volgende voorwaarde. Als u een overeenkomende regel instelt voor een numeriek domein en u vergelijkbaarselecteert, kunt u een tolerantie invoeren als een percentage of een geheel getal. Voor een domein van het type datum kunt u een tolerantie invoeren als een dag, maand of jaar (geheel getal) als u vergelijkbareselecteert; er is geen percentagetolerantie voor een datumdomein. Als u Exactselecteert, hebt u deze optie niet.
Vergelijkbaarheid van vergelijkbaar: selecteer vergelijkbaar als twee waarden in hetzelfde veld van twee verschillende records als een overeenkomst kunnen worden beschouwd, zelfs als de waarden niet identiek zijn. Wanneer DQS de regel uitvoert, wordt een overeenkomende score voor dat domein berekend en worden die score en de scores voor de andere domeinen in de regel gebruikt om de cumulatieve overeenkomende score te bepalen. De minimale overeenkomst tussen de waarden van een veld is 60%. Als de berekende overeenkomende score voor een veld van twee records kleiner is dan 60, wordt de overeenkomstscore automatisch ingesteld op 0. Als u een overeenkomende regel instelt voor een numeriek veld en u vergelijkbareselecteert, kunt u een tolerantie invoeren als een percentage of geheel getal. Als u een overeenkomende regel instelt voor een datumveld en u vergelijkbareselecteert, kunt u een numerieke tolerantie invoeren.
Vereiste: Selecteer Vereiste om op te geven dat de waarden in hetzelfde veld in twee verschillende records een 100% match moeten retourneren, anders worden de records niet beschouwd als een match en worden de andere clausules in de regel genegeerd. Wanneer Vereiste is geselecteerd, wordt het gewichtsveld voor het domein verwijderd, zodat u geen gewicht voor het domein kunt definiëren. U moet een of meer domeingewichten opnieuw instellen, zodat de som van de gewichten gelijk is aan 100. Vereiste domeinen dragen niet bij aan de score voor recordmatching. De recordkoppelingsscore wordt bepaald door de waarden in velden te vergelijken waarvoor de gelijkheidsgraad als Vergelijkbaar of Exact is ingesteld. Wanneer u een veld een vereiste maakt, wordt de gelijkenis voor dat domein automatisch ingesteld op Exact.
De minimale score voor overeenstemming is de drempel waarbij of waarboven twee records als een overeenkomst worden beschouwd (en de status voor de records is ingesteld op 'Overeenkomend'). Voer een geheel getal in stappen van '1' in of klik op de pijl-omhoog of pijl-omlaag om de waarde in stappen van '10' te verhogen of te verlagen. De minimumwaarde is 80. Als de matchscore lager is dan 80, worden de twee records niet als een match beschouwd. U kunt het bereik van de minimale overeenkomende score op deze pagina niet wijzigen. De laagste min. overeenkomende score is 80. U kunt echter de laagste minimum overeenkomende score wijzigen op de pagina Beheer (als u een DQS-beheerder bent).
Het maken van een overeenkomende regel is een iteratief proces, omdat u mogelijk de relatieve gewichten van de domeinen in de regel, of de overeenkomst of de vereiste eigenschap voor een domein, of de minimale overeenkomende score voor de regel moet wijzigen om de resultaten te bereiken die u nodig hebt. U kunt ook merken dat u meerdere regels moet maken, die elk worden uitgevoerd om de overeenkomende score te maken. Het kan lastig zijn om het resultaat te bereiken dat u nodig hebt met slechts één regel. Meerdere regels bieden diverse perspectieven van een benodigde overeenkomst. Met meerdere regels kunt u mogelijk minder domeinen in elke regel opnemen, hogere gewichten voor elk domein gebruiken en betere resultaten bereiken. Als de gegevens minder nauwkeurig en minder volledig zijn, hebt u mogelijk meer regels nodig om vereiste overeenkomsten te vinden. Als de gegevens nauwkeuriger en vollediger zijn, hebt u minder regels nodig.
Profilering geeft inzicht in volledigheid en uniekheid. Houd rekening met volledigheid en uniekheid in combinatie. Gebruik volledigheids- en uniekheidsgegevens om te bepalen welk gewicht een veld in het overeenkomende proces moet geven. Als er een hoog niveau van uniekheid in een veld is, kan het gebruik van het veld in een overeenkomend beleid de overeenkomende resultaten verminderen, dus u kunt het gewicht voor dat veld instellen op een relatief kleine waarde. Als u een laag niveau van uniekheid voor een kolom hebt, maar weinig volledigheid hebt, wilt u mogelijk geen domein voor die kolom opnemen. Met een laag uniekheidsniveau, maar een hoog volledigheidsniveau, wilt u het domein misschien opnemen. Sommige kolommen, zoals geslacht, kunnen natuurlijk een laag niveau van uniekheid hebben. Zie profiler- en resultatentabbladenvoor meer informatie.
Eerste stap: Een overeenkomend beleid starten
U voert de overeenkomende beleidsactiviteit uit in het knowledge base-beheergebied van de toepassing Data Quality Client.
Start de client voor gegevenskwaliteit. Zie voor meer informatie hierover De clienttoepassing voor gegevenskwaliteit uitvoeren.
Klik in het startscherm van de Data Quality Client op Nieuwe knowledge base om een overeenkomend beleid te maken in een nieuwe knowledge base. Voer een naam in voor de kennisbank, geef een beschrijving en stel 'Maak kennisbank aan op basis van' naar wens in. Klik op bijbehorend beleid voor deze activiteit. Klik op Volgende om door te gaan.
Klik op Kennisbank openen om het bijbehorende beleid in een bestaande kennisbank te maken of te wijzigen. Selecteer de kennisbank, selecteer overeenkomend beleiden klik vervolgens op Volgende. U kunt ook op een kennisbank klikken onder Recente Kennisbank. Als u een kennisbank opent die werd gesloten terwijl er aan een overeenkomend beleid werd gewerkt, gaat u verder met de fase waarin de activiteit van het overeenkomende beleid werd afgesloten (zoals aangegeven in de kolom Status voor de kennisbank in de kennisbanktabel of in de naam van de kennisbank onder Recente Kennisbank). Als u een knowledge base opent die een overeenkomend beleid bevat en is voltooid, gaat u naar de pagina Overeenkomend beleid. Als u een knowledge base opent die geen overeenkomend beleid bevat en is voltooid, dan wordt u naar de Toewijzing pagina geleid.
In kaart brengen fase
In de toewijzingsfase identificeert u de bron van de gegevens waarvoor u het overeenkomende beleid maakt en wijst u bronkolommen toe aan domeinen om de domeinen beschikbaar te maken voor de overeenkomende beleidsactiviteit.
Op de Kaart pagina maakt u een beleid voor een database, laat Gegevensbron als SQL Server, selecteer de database waarvoor u het beleid wilt maken in Database, en selecteer vervolgens de tabel of weergave in Tabel/Weergave. De brondatabase moet aanwezig zijn in hetzelfde SQL Server-exemplaar als Data Quality Server. Anders wordt deze niet weergegeven in de vervolgkeuzelijst.
Als u een beleid voor de gegevens in een Excel-spreadsheet wilt maken, selecteert u Excel-bestand voor gegevensbron, klikt u op Bladeren en selecteert u het Excel-bestand en laat u Eerste rij gebruiken als koptekst geselecteerd, indien van toepassing. Selecteer in Werkbladhet werkblad in het Excel-bestand dat de bron van de gegevens is. Microsoft Excel moet zijn geïnstalleerd op de clientcomputer voor gegevenskwaliteit om een Excel-bestand te selecteren. Anders is de knop Bladeren niet beschikbaar en krijgt u onder dit tekstvak een melding dat Microsoft Excel niet is geïnstalleerd.
Selecteer onder Toewijzingeneen veld voor bronkolomen klik vervolgens op het pictogram Domein maken.
Selecteer onder Toewijzingeneen veld in de gegevensbron voor bronkolomen selecteer vervolgens het bijbehorende domein. Herhaal dit voor alle domeinen die u in het overeenkomende proces gebruikt. Maak indien nodig domeinen door te klikken op Een domein maken of Een samengesteld domein maken.
Notitie
U kunt de brongegevens alleen toewijzen aan een DQS-domein terwijl u een overeenkomend beleid maakt als het brongegevenstype wordt ondersteund in DQS en overeenkomt met het gegevenstype DQS-domein. Zie Ondersteunde SQL Server- en SSIS-gegevenstypen voor DQS-domeinenvoor informatie over ondersteunde gegevenstypen in DQS.
Klik op het plus (+) bedieningselement om een rij toe te voegen aan de tabel Toewijzingen of op het min (-) bedieningselement om een rij te verwijderen.
Klik op Voorbeeld van gegevensbron om de gegevens weer te geven in de SQL Server-tabel of -weergave die u hebt geselecteerd, of het Excel-werkblad dat u hebt geselecteerd.
Klik op Bekijk/Selecteer Samengestelde Domeinen om een lijst weer te geven met de samengestelde domeinen die beschikbaar zijn in de Knowledge Base, en selecteer deze indien nodig voor mapping.
Klik op Volgende om door te gaan naar de overeenkomende beleidsfase.
Notitie
Klik op Sluiten om de fase van het overeenkomende project op te slaan en terug te keren naar de startpagina van DQS. De volgende keer dat u dit project opent, begint het vanaf dezelfde fase. Klik op annuleren om de overeenkomende activiteit te beëindigen, uw werk te verliezen en terug te keren naar de startpagina van DQS.
Overeenkomende beleidsfase
U maakt overeenkomende regels en test deze afzonderlijk op de pagina Overeenkomend beleid. Wanneer u een overeenkomende regel test op de pagina Overeenkomend beleid, ziet u een overeenkomende resultatentabel met de clusters die DQS heeft geïdentificeerd voor de geselecteerde regel. In de tabel ziet u elk record in het cluster met de domeinwaarden en overeenkomstige scores, en het initiële draairecord voor het cluster. U kunt ook profileringsgegevens weergeven voor het overeenkomende proces als geheel, de voorwaarden in elke overeenkomende regel en statistieken over de resultaten voor elke overeenkomende regel afzonderlijk. U kunt filteren op de gewenste hoofdregelgegevens.
Zie Overeenkomende regelparameters instellenvoor meer informatie over hoe overeenkomende regels werken.
Klik op de pagina overeenkomend beleid op het pictogram Een overeenkomende regel maken.
Voer een naam en beschrijving in voor de regel.
Verhoog de waarde van de Min. overeenkomende score als u de overeenkomende vereisten strenger wilt maken. Zie Hoe de parameters voor overeenkomende regels in te stellenvoor meer informatie over de minimale overeenkomende score.
Klik op het pictogram Een nieuw domeinelement toevoegen.
Selecteer een domein of samengesteld domein om regelwaarden voor in te voeren.
Notitie
U kunt alleen een samengesteld domein selecteren als elk domein in het samengestelde domein is toegewezen aan een bronkolom.
Voor overeenkomstselecteert u vergelijkbaar als twee waarden in hetzelfde veld van twee verschillende records als een match kunnen worden beschouwd, zelfs als ze niet identiek zijn. Selecteer Exact als twee waarden in hetzelfde veld van twee verschillende records identiek moeten zijn om als een overeenkomst te worden beschouwd. (Zie Overeenkomende regelparameters instellenvoor meer informatie.)
Voer voor Gewichteen waarde in waarmee de bijdrage van de overeenkomende score van een domein aan de algehele overeenkomende score voor twee records wordt bepaald.
Notitie
Wanneer u een gewicht definieert voor een samengesteld domein, kunt u een ander gewicht invoeren voor elk domein in het samengestelde domein, in welk geval het samengestelde domein geen afzonderlijk gewicht krijgt, of u kunt één gewicht invoeren voor het samengestelde domein, waarin de enkele domeinen in het samengestelde domein geen afzonderlijke gewichten krijgen.
Selecteer Vereiste om op te geven dat de waarden voor het veld in de twee records een 100% overeenkomst moeten opleveren, anders worden de records niet als een overeenkomst beschouwd en worden de andere clausules in de regel genegeerd. Als de gelijkenisvergelijkbaar is met, verandert deze in Exacten wordt het gewicht verwijderd omdat de overeenkomst 100%moet zijn.
Herhaal stap 4 tot en met 8 voor alle andere domeinen die deel uitmaken van de overeenkomende regel. Zorg ervoor dat de som van de gewichten voor alle domeinen in de regel gelijk is aan 100.
Selecteer Overlappende clusters in de vervolgkeuzelijst om de draaitabelrecords en vervolgrecords weer te geven voor alle clusters wanneer het matchen wordt uitgevoerd, zelfs als groepen clusters records delen. Selecteer Niet-overlappende clusters om clusters die records gemeen hebben als één cluster weer te geven wanneer het matchingsproces wordt uitgevoerd.
Klik op Gegevens opnieuw laden uit de bron om gegevens uit de gegevensbron naar de faseringstabel te kopiëren en opnieuw te indexeren wanneer u het overeenkomende beleid uitvoert. Klik op Uitvoeren op vorige gegevens om een overeenkomend beleid uit te voeren zonder de gegevens naar de faseringstabel te kopiëren en de gegevens opnieuw te indexeren. Uitvoeren op eerdere gegevens is uitgeschakeld voor de eerste uitvoering van de overeenkomende beleidsregel of als u het toewijzingsschema wijzigt op de pagina Kaart en vervolgens op Ja in de volgende pop-up drukt. In beide gevallen moet u opnieuw indexeren. Het is niet nodig om opnieuw te indexeren als het overeenkomende beleid niet is gewijzigd. Het uitvoeren van eerdere gegevens kan helpen bij de prestaties.
Klik op Start om het overeenkomende proces voor de geselecteerde regel uit te voeren. Wanneer het proces is voltooid, worden in de tabel de kolommen Record-id, Clusternummer en Gegevens weergegeven (inclusief de kolommen die niet in de overeenkomende regel staan) voor elke record in een cluster. De pivotrij in het cluster wordt beschouwd als de belangrijkste kandidaat om het ontdubbelingsproces te doorstaan. Elke extra rij in een cluster wordt beschouwd als een duplicaat; de overeenkomende score (vergeleken met de draairecord) wordt weergegeven in de resultatentabel. Het clusternummer is hetzelfde als de record-id voor de draairecord in het cluster.
U kunt als volgt werken met de gegevens in de overeenkomende resultaten tabel:
In Filterselecteer je Overeenkomende om alle overeenkomende rijen en hun score weer te geven. Rijen die niet als overeenkomsten worden beschouwd (die een overeenkomende score hebben die kleiner is dan de minimale overeenkomende score), worden niet weergegeven in de overeenkomende resultatentabel. Selecteer Niet-overeenkomende om alle niet-overeenkomende rijen weer te geven, in plaats van overeenkomende rijen.
Selecteer in de vervolgkeuzelijst percentageeen percentage in de vervolgkeuzelijst, in stappen van '5'. Alle rijen met een overeenkomende score die groter dan of gelijk aan dat percentage is, worden weergegeven in de overeenkomende resultatentabel.
Als u dubbelklikt op een record in de tabel met overeenkomstige resultaten, geeft DQS een pop-upvenster weer met details van de overeenkomende score, inclusief het draaipuntrecord en het bronrecord (en de waarden in al hun velden), de score ertussen en een uitwerking van de overeenkomstige record. In de inzoomweergave worden de waarden in elk veld van de draairecord en bronrecord weergegeven, zodat u deze kunt vergelijken en de overeenkomende score weergeeft die elk veld bijdraagt aan de algehele overeenkomende score voor de twee records.
Bekijk de statistieken in de Profiler-- en Overeenkomende Resultaten--tabbladen om ervoor te zorgen dat u de resultaten bereikt die u nodig heeft. Zie profiler- en resultatentabbladenvoor meer informatie.
Als de regel moet worden gewijzigd, wijzigt u deze in de regeleditor en klikt u op Opnieuw opstarten.
Notitie
Nadat de eerste analyse is voltooid, verandert de knop Start in een knop Opnieuw opstarten. Als de resultaten van de vorige analyse nog niet zijn opgeslagen, zal klikken op Opnieuw opstarten ervoor zorgen dat de eerdere gegevens verloren gaan. Verlaat de pagina niet terwijl de analyse wordt uitgevoerd, anders wordt het analyseproces beëindigd.
Op het tabblad Overeenkomende resultaten worden statistieken weergegeven voor de laatste twee uitvoeringen van de regel. Als u de overeenkomende regel meerdere keren hebt uitgevoerd met verschillende instellingen, vergelijkt u de statistieken voor de huidige regel en de vorige regel. Als u merkt dat de resultaten van de vorige regel beter waren, klikt u op Vorige regel herstellen om de voorwaarden van de vorige regel te herstellen, waarbij de regel wordt geretourneerd naar de vorige status voordat u deze bewerkt. De huidige regelvoorwaarden gaan verloren. Hiermee kunt u het beleid afstemmen op basis van de laatste twee overeenkomende uitvoeringen, waardoor u minder tijd besteedt aan het afstemmen van het overeenkomende beleid.
Als u wilt dat een andere regel wordt toegevoegd aan het overeenkomende beleid, herhaalt u dit uit stap 1.
Klik op Volgende om door te gaan naar de fase met overeenkomstige resultaten.
Fase van overeenkomende resultaten
U test al uw overeenkomende regels tegelijk op de pagina Overeenkomende resultaten. Voordat u dit doet, kunt u aangeven dat de regeltestuitvoering overlappende of niet-overlappende clusters identificeert. Als u de regels meerdere keren uitvoert, kunt u de regel uitvoeren voor opnieuw geladen gegevens uit de bron of op eerdere gegevens.
Wanneer u de overeenkomende regels test op de pagina Overeenkomende resultaten, ziet u een overeenkomende resultatentabel met de clusters die DQS heeft geïdentificeerd voor alle regels. In de tabel ziet u elke record in het cluster met de toewijzingsdomeinwaarden en overeenkomende score en de eerste draairecord voor het cluster. U kunt ook profileringsgegevens weergeven voor de overeenkomende regels als geheel, de voorwaarden in elke overeenkomende regel en statistieken over de resultaten voor alle overeenkomende regels.
Selecteer in de vervolgkeuzelijst op de pagina overeenkomende resultaten de optie Overlappende clusters om de pivot records en onderliggende records voor alle clusters weer te geven wanneer matching wordt uitgevoerd, zelfs als groepen clusters gezamenlijke records bevatten. Selecteer Niet-overlappende clusters om clusters weer te geven die gemeenschappelijke records als één cluster beschouwen wanneer de matching wordt uitgevoerd.
Klik op Gegevens opnieuw laden uit de bron om gegevens uit de gegevensbron naar de faseringstabel te kopiëren en opnieuw te indexeren wanneer u het overeenkomende beleid uitvoert. Klik op Uitvoeren op vorige gegevens om een overeenkomend beleid uit te voeren zonder de gegevens naar de faseringstabel te kopiëren en de gegevens opnieuw te indexeren. Uitvoeren op eerdere gegevens is uitgeschakeld tijdens de eerste uitvoering van het matchingbeleid, of als u de mapping wijzigt op de Kaart-pagina en vervolgens op Ja drukt in de volgende pop-up. In beide gevallen moet u opnieuw indexeren. Het is niet nodig om opnieuw te indexeren als het overeenkomende beleid niet is gewijzigd. Het uitvoeren van eerdere gegevens kan helpen bij de prestaties.
Klik op Start om het overeenkomende proces uit te voeren voor alle regels die u hebt gedefinieerd. De overeenkomende resultaten tabel bevat de record-id, het clusternummer en de gegevenskolommen (inclusief de kolommen die niet in de overeenkomende regel staan) voor elke record in een cluster. Het leidende record in het cluster wordt willekeurig geselecteerd. (U bepaalt het overblijvende record door de overlevingsregel te selecteren op de pagina Exporteren wanneer u het overeenkomende project uitvoert.) Elke extra rij in een cluster wordt beschouwd als een duplicaat; de overeenkomende score ten opzichte van het pivotrecord wordt weergegeven in de resultatentabel.
U kunt als volgt werken met de gegevens in de overeenkomende resultaten tabel:
Selecteer in FilterOvereenkomende om alle overeenkomende rijen en de bijbehorende score weer te geven. Rijen die niet als overeenkomsten worden beschouwd (die een overeenkomende score hebben die kleiner is dan de minimale overeenkomende score), worden niet weergegeven in de overeenkomende resultatentabel. Selecteer Niet-overeenkomende om alle niet-overeenkomende rijen weer te geven, niet de rijen die wel overeenkomen.
Selecteer in de vervolgkeuzelijst Percent Drop Down Boxeen percentage uit de lijst met stappen van 5. Alle rijen met een overeenkomende score die groter dan of gelijk aan dat percentage is, worden weergegeven in de overeenkomende resultatentabel.
Als u dubbelklikt op een record in de overeenkomende resultatentabel, wordt in DQS een overeenkomende scoredetails weergegeven pop-up met de draairecord en bronrecord (en de waarden in alle velden), de score ertussen en een inzoom van de overeenkomende record. In de inzoomweergave worden de waarden in elk veld van de draaipuntrecord en bronrecord weergegeven, zodat u deze kunt vergelijken, en wordt tevens de overeenkomende score getoond die elk veld bijdraagt aan de totale overeenkomende score voor de twee records.
Bekijk de statistieken in de Profiler- en overeenkomende resultaten tabbladen om ervoor te zorgen dat u de resultaten bereikt die u nodig hebt. Klik op het tabblad Overeenkomende regels om te zien wat de domeininstellingen voor elke regel zijn. Zie profiler- en resultatentabbladenvoor meer informatie.
Als u niet tevreden bent met de resultaten van alle regels, klikt u op Vorige om terug te keren naar de pagina Regels matchen, wijzig een of meer regels indien nodig, keer terug naar de pagina Matchende resultaten, en klik vervolgens op Opnieuw starten.
Notitie
Nadat de analyse is voltooid, verandert de knop Start in een knop Opnieuw opstarten. Als de resultaten van de vorige analyse nog niet zijn opgeslagen, zal klikken op Opnieuw opstarten ervoor zorgen dat de eerdere gegevens verloren gaan.
Als u tevreden bent met de resultaten van alle regels, klikt u op voltooien om het overeenkomende beleidsproces te voltooien en klikt u vervolgens op een van de volgende opties:
Ja: de knowledge base publiceren enafsluiten: de knowledge base wordt gepubliceerd voor de huidige gebruiker of andere gebruikers. De knowledge base wordt niet vergrendeld, de status van de knowledge base (in de knowledge base-tabel) wordt ingesteld op leeg en zowel de activiteiten domeinbeheer als kennisdetectie zijn beschikbaar. U keert terug naar het scherm Open Knowledge Base.
Nee - sla het werk op in de kennisbank en sluit af: uw werk wordt opgeslagen, de kennisbank blijft vergrendeld en de status van de kennisbank wordt ingesteld op In werk. Zowel de domeinbeheer- als kennisdetectieactiviteiten zijn beschikbaar. U keert terug naar de startpagina.
Annuleren - Blijf op het huidige scherm: de pop-up wordt gesloten en u keert terug naar het scherm Domeinbeheer.
Klik op sluiten om uw werk op te slaan en ga terug naar de startpagina van DQS. In de status van de kennisbank wordt de tekenreeks "Overeenkomend beleid - " en de huidige status weergegeven. Als u op sluiten hebt geklikt terwijl u zich in het scherm overeenkomend resultaat bevindt, wordt de status weergegeven: 'Overeenkomend beleid - resultaten'. Als u op sluiten hebt geklikt terwijl u zich in het scherm overeenkomend beleid bevindt, wordt de status weergegeven: 'Overeenkomend beleid - overeenkomend beleid'. Nadat u op Sluitenhebt geklikt, moet u de activiteit Knowledge Discovery uitvoeren door terug te keren naar de activiteit Overeenkomend beleid. Klik op Voltooienen klik vervolgens op Ja om de kennisbasis te publiceren of op Nee om het werk op de kennisbasis op te slaan en af te sluiten.
Notitie
Als u op sluiten klikt terwijl een overeenkomend proces wordt uitgevoerd, wordt het overeenkomende proces niet beëindigd wanneer u op sluiten klikt. U kunt de knowledge base opnieuw openen en zien dat het proces nog steeds wordt uitgevoerd, of als dit is voltooid, dat de resultaten worden weergegeven. Als het proces niet is voltooid, wordt de voortgang weergegeven op het scherm.
Klik op Annuleren om de activiteit Overeenstemmingsbeleid te beëindigen. U verliest uw werk en keert terug naar de startpagina van DQS.
Opvolgen: Na het maken van een overeenkomend beleid
Nadat u een overeenkomend beleid hebt gemaakt, kunt u een overeenkomend project uitvoeren op basis van de knowledge base die het overeenkomende beleid bevat. Zie Een overeenkomend projectuitvoeren voor meer informatie.
Profiler- en resultatentabbladen
Het tabblad Profiler en Resultaten bevat statistieken voor zowel het afstemmingsbeleid als de pagina's met afstemmingsresultaten.
Tabblad Profiler
Klik op het tabblad Profiler om statistieken weer te geven voor de brondatabase en voor elk veld dat is opgenomen in de beleidsregel. De statistieken worden bijgewerkt wanneer de beleidsregel wordt uitgevoerd.
Zie Overeenkomende regelparameters instellenvoor meer informatie over het interpreteren van de volgende statistieken.
De statistieken van de brondatabase bevatten het volgende:
records: het totale aantal records in de brondatabase
totaalwaarden: het totale aantal waarden in de velden van de gegevensbron
Nieuwe waarden: het totale aantal waarden dat nieuw is sinds de vorige uitvoering en het percentage van het gehele
unieke waarden: het totale aantal unieke waarden in de velden en het percentage van het geheel
Nieuwe unieke waarden: het totale aantal unieke waarden dat nieuw is in de velden en het percentage van het geheel
De veldstatistieken omvatten het volgende:
veldnaam
domeinnaam
Nieuwe: het aantal nieuwe waarden en het percentage nieuwe waarden in vergelijking met bestaande waarden in het domein
Unieke: het aantal unieke records in het veld en het percentage van het totaal
Volledigheid: de volledigheid van elk bronveld dat is gemapt voor de matching oefening
Overeenkomende beleidsmeldingen
Voor de overeenkomende beleidsactiviteit resulteren de volgende voorwaarden in meldingen:
Het veld is leeg in alle records; het wordt aanbevolen om het uit de toewijzing te verwijderen.
De volledigheidsscore van het veld is zeer laag; u kunt overwegen om het uit de mapping te verwijderen.
Alle waarden in een veld zijn ongeldig; controleer de toewijzing en de toepasbaarheid van domeinregels voor de inhoud van het veld.
Er is een laag aantal geldige waarden in het veld; controleer de koppeling en de relevantie van domeinregels voor de veldinhoud.
Er is een hoog niveau van uniekheid in dit veld. Als u dit veld in overeenkomend beleid gebruikt, kunt u de overeenkomende resultaten verminderen.
Tabblad met Overeenkomende Resultaten
Klik op het tabblad overeenkomende resultaten om statistieken weer te geven voor de uitvoering van de overeenkomende beleidsregel en de vorige regeluitvoering. Als u dezelfde regel meerdere keren hebt uitgevoerd met verschillende parameters, worden in de overeenkomende resultatentabel statistieken weergegeven voor beide uitvoeringen, zodat u deze kunt vergelijken. U kunt desgewenst ook de vorige regel herstellen.
De statistieken omvatten het volgende:
Het totale aantal records in de database
Het totale aantal overeenkomende records in de database
Het aantal records in de database dat niet als duplicaten wordt beschouwd
Het aantal gedetecteerde clusters
De gemiddelde clustergrootte (aantal dubbele records gedeeld door het aantal clusters)
Het minste aantal duplicaten in een cluster
Het grootste aantal duplicaten in een cluster