Skapa en matchande policy
gäller för:SQL Server
Det här avsnittet beskriver hur du skapar en matchningspolicy i en kunskapsbas i Data Quality Services (DQS). Du förbereder dig för matchningsprocessen i DQS genom att köra aktiviteten Matchningsprincip på exempeldata. I den här aktiviteten skapar och testar du en eller flera matchande regler i principen och publicerar sedan kunskapsbasen för att göra matchande regler offentligt tillgängliga för användning. Det kan bara finnas en matchande princip i en kunskapsbas, men den principen kan innehålla flera matchande regler.
Matchande principskapande utförs i tre steg: en mappningsprocess där du identifierar datakällan och mappar domäner till kolumner, en matchande principprocess där du skapar en eller flera matchande regler och testar varje matchande regel separat och en matchande resultatprocess där du kör alla matchande regler tillsammans, och om du är nöjd med dem, lägg till principen i kunskapsbasen. Var och en av dessa processer utförs på en separat sida i guiden Matchande principaktivitet, så att du kan flytta fram och tillbaka till olika sidor, köra processen igen och stänga av en specifik matchningsprincipprocess och återgå till samma fas i processen. När du har testat alla regler tillsammans kan du, om du vill, återgå till sidan Matchningsprincip, justera en enskild regel, testa den igen separat och sedan gå tillbaka till sidan Matchande resultat för att köra alla regler tillsammans igen. DQS ger dig statistik om källdata, matchningsregler och matchande resultat som gör att du kan fatta välgrundade beslut om matchningsprincipen, så att du kan förfina den.
Innan du börjar
Förutsättningar
Microsoft Excel måste installeras på datakvalitetsklientdatorn om källdata finns i en Excel-fil. Annars kan du inte välja Excel-filen i mappningsfasen. Filerna som skapas av Microsoft Excel kan ha ett tillägg av .xlsx, .xlseller .csv. Om 64-bitarsversionen av Excel används stöds endast Excel 2003-filer (.xls). Excel 2007- eller 2010-filer (.xlsx) stöds inte. Om du använder 64-bitarsversionen av Excel 2007 eller 2010 sparar du filen som en .xls fil eller en .csv fil eller installerar en 32-bitarsversion av Excel i stället.
Säkerhet
Behörigheter
Du måste ha dqs_kb_editor- eller dqs_administrator-rollen på DQS_MAIN-databasen för att skapa en matchande princip.
Så här anger du matchande regelparametrar
Att skapa en matchningsregel är en iterativ process där du anger de faktorer som används för att avgöra om en post matchar en annan. Du kan ange villkor för alla domäner i en tabell. När DQS utför matchning på två poster jämförs värdena i fälten som mappas till de domäner som ingår i matchningsregeln. DQS analyserar värdena i varje fält i regeln och använder sedan de faktorer som anges i regeln för varje domän för att beräkna en slutlig matchningspoäng. Om matchningspoängen för de två posterna som jämförs är större än den lägsta matchningspoängen, betraktas de två fälten som matchningar.
De faktorer som du anger i en matchande regel är följande:
Vikt: För varje domän i regeln anger du en numerisk vikt som avgör hur matchande analys för domänen ska jämföras med den för varandras domän i regeln. Vikten visar hur fältets resultat bidrar till det sammanlagda matchningsresultatet mellan två poster. De beräknade poängen som tilldelas varje källfält summeras tillsammans för en sammansatt matchningspoäng för de två posterna. För varje fält som inte är en förutsättning (med en likhet av exakt eller liknande) anger du vikten mellan 10 och 100. Summan av vikterna för de domäner som inte är nödvändiga måste vara lika med 100. Om värdet är en förutsättning anges vikten till 0 och kan inte ändras.
Likhet med Exakt: Välj Exakt om värdena i samma fält i två olika poster måste vara identiska för att värdena ska anses vara en matchning. Om det är identiskt anges matchningspoängen för den domänen till "100", och DQS använder den poängen och poängen för de andra domänerna i regeln för att fastställa den aggregerade matchningspoängen. Om den inte är identisk kommer matchningspoängen för den domänen att anges till "0", och bearbetningen av regeln fortsätter till nästa villkor. Om du konfigurerar en matchande regel för en numerisk domän och väljer Liknandekan du ange en tolerans antingen som en procentandel eller ett heltal. För en domän av typen datum kan du ange en tolerans som en dag, månad eller år (heltal) om du väljer Liknande; Det finns ingen procentuell tolerans för en datumdomän. Om du väljer Exacthar du inte det här alternativet.
Likhet med liknande: Välj Liknande om två värden i samma fält med två olika poster kan betraktas som en matchning även om värdena inte är identiska. När DQS kör regeln beräknar den en matchande poäng för den domänen och använder den poängen och poängen för de andra domänerna i regeln för att fastställa den aggregerade matchningspoängen. Den minsta likheten mellan värdena för ett fält är 60%. Om den beräknade matchningspoängen för ett fält med två poster är mindre än 60 anges likhetspoängen automatiskt till 0. Om du konfigurerar en matchande regel för ett numeriskt fält och väljer Liknandekan du ange en tolerans i procent eller heltal. Om du konfigurerar en matchande regel för ett datumfält och väljer Liknandekan du ange en numerisk tolerans.
Krav: Välj Krav för att ange att värdena i samma fält i två olika poster måste returnera en matchning på 100% eller att posterna inte betraktas som en matchning och att de andra satserna i regeln ignoreras. När Krav har valts tas viktfältet för domänen bort så att du inte kan definiera en vikt för domänen. Du måste återställa en eller flera domänvikter så att summan av vikterna är lika med 100. Domäner med förhandsvillkor bidrar inte till rekordmatchningspoängen. Matchningspoängen för posten bestäms genom att jämföra värdena i fält för vilka likheten är inställd på Liknande eller Exakt. När du gör ett fält till en förutsättning anges likheten för den domänen automatiskt till Exakt.
Den minimala matchningspoängen är tröskelnivån vid vilken eller över vilken två registerposter anses vara en matchning (och statusen för posterna är inställd på "Matchad"). Ange ett heltalsvärde i steg om "1" eller klicka på uppåt- eller nedåtpilen för att öka eller minska värdet i steg om "10". Minimivärdet är 80. Om matchningspoängen är under 80 betraktas de två posterna inte som en matchning. Du kan inte ändra intervallet för den minsta matchande poängen på den här sidan. Den lägsta min. matchningspoängen är 80. Du kan dock ändra den lägsta matchningspoängen på sidan Administration (om du är DQS-administratör).
Att skapa en matchande regel är en iterativ process eftersom du kan behöva ändra de relativa vikterna för domänerna i regeln, likheten eller förutsättningsegenskapen för en domän, eller minsta matchande poäng för regeln, för att uppnå de resultat som du behöver. Du kan också upptäcka att du behöver skapa flera regler, som vart och ett körs för att skapa matchande poäng. Det kan vara svårt att uppnå det resultat du behöver med bara en regel. Flera regler ger olika vyer av en obligatorisk matchning. Med flera regler kan du kanske inkludera färre domäner i varje regel, använda högre vikter för varje domän och uppnå bättre resultat. Om data är mindre exakta och mindre fullständiga kan du behöva fler regler för att hitta nödvändiga matchningar. Om data är mer exakta och fullständiga behöver du färre regler.
Profilering ger insikter om fullständighet och unikhet. Överväg fullständighet och unikhet tillsammans. Använd fullständighets- och unikhetsdata för att avgöra vilken vikt som ska ge ett fält i matchningsprocessen. Om det finns en hög nivå av unikhet i ett fält kan användning av fältet i en matchningsprincip minska matchningsresultaten, så du kanske vill ange fältets vikt till ett relativt litet värde. Om du har en låg unikhetsnivå för en kolumn, men med låg fullständighet, kanske du inte vill inkludera en domän för den kolumnen. Med en låg unikhetsnivå, men en hög nivå av fullständighet, kanske du vill inkludera domänen. Vissa kolumner, till exempel kön, kan naturligtvis ha en låg unikhetsnivå. För mer information, se Profiler och resultatflikarna.
Första steget: Starta en matchningspolicy
Du utför matchande principaktivitet i kunskapsbashanteringsområdet i klientprogrammet för datakvalitet.
Starta datakvalitetsklienten. Information om hur du gör det finns i Kör klientprogrammet för datakvalitet.
På startskärmen för datakvalitetsklient klickar du på Ny kunskapsbas för att skapa en matchande princip i en ny kunskapsbas. Ange ett namn för kunskapsbasen, ange en beskrivning och ange Skapa kunskapsbas från efter behov. Klicka på matchande princip för aktiviteten. Klicka på Nästa för att fortsätta.
Klicka på Öppna kunskapsbasen för att skapa eller ändra matchningsprincipen i en befintlig kunskapsbas. Välj kunskapsbasen, välj Matchningsprincipoch klicka sedan på Nästa. Du kan också klicka på en kunskapsbas under Senaste kunskapsbasen. Om du öppnar en kunskapsbas som stängdes när en matchande princip arbetades med går du vidare till den fas som matchande principaktivitet stängdes i (vilket anges av kolumnen State för kunskapsbasen i kunskapsbastabellen eller i kunskapsbasnamnet under Senaste kunskapsbasen). Om du öppnar en kunskapsbas som innehåller en matchningsprincip och som har avslutats kommer du att hamna på sidan Matchningsprincip. Om du öppnar en kunskapsbas som inte innehåller en matchande princip och har slutförts går du till sidan Mappning.
Kartläggningsfas
I mappningssteget identifierar du datakällan som du ska skapa matchande princip för och mappar källkolumner till domäner för att göra domänerna tillgängliga för matchande principaktivitet.
På sidan Map, för att skapa en policy för en databas, lämna Datasource som SQL Server, välj den databas du vill skapa policyn för i Databasoch välj sedan tabellen eller vyn i Tabell/Vy. Källdatabasen måste finnas i samma SQL Server-instans som Data Quality Server. Annars visas den inte i listrutan.
För att skapa en riktlinje för data i ett Excel-kalkylblad, välj Excel-fil för datakälla, klicka på Bläddra och välj Excel-filen. Lämna Använd första raden som rubrik markerad om det är lämpligt. I kalkylbladväljer du kalkylbladet i Excel-filen som ska vara datakällan. Microsoft Excel måste vara installerat på datakvalitetsklientdatorn för att välja en Excel-fil. Annars är knappen Bläddra inte tillgänglig och du får ett meddelande under den här textrutan om att Microsoft Excel inte är installerat.
Under Mappningarväljer du ett fält för Källkolumnoch klickar sedan på ikonen Skapa domän.
Under Mappningarväljer du ett fält i datakällan för Källkolumnoch väljer sedan motsvarande domän. Upprepa för alla domäner som du använder i matchningsprocessen. Skapa domäner efter behov genom att klicka på Skapa en domän eller Skapa en sammansatt domän.
Not
Du kan mappa dina källdata till en DQS-domän när du skapar en matchande princip endast om källdatatypen stöds i DQS och matchar DQS-domänens datatyp. Information om datatyper som stöds i DQS finns i SQL Server- och SSIS-datatyper som stöds för DQS-domäner.
Klicka på kontrollen plus (+) för att lägga till en rad i tabellen Mappningar eller minus (-) kontroll för att ta bort en rad.
Klicka på Förhandsgranska datakälla för att se data i SQL Server-tabellen eller vyn som du har valt, eller det Excel-kalkylblad som du har valt.
Klicka på Visa/Välj sammansatta domäner för att visa en lista över de sammansatta domäner som är tillgängliga i kunskapsbasen och välj efter behov för mappning.
Klicka på Nästa för att gå vidare till matchande principsteg.
Not
Klicka på Stäng för att spara fasen i det matchande projektet och gå tillbaka till startsidan för DQS. Nästa gång du öppnar det här projektet börjar det från samma fas. Klicka på Avbryt för att avsluta matchningsaktiviteten, vilket gör att du förlorar ditt arbete, och återgå till DQS-startsidan.
Matcherande policyfas
Du skapar matchande regler och testar dem individuellt på sidan Matchningsprincip. När du testar en matchande regel på sidan matchande princip visas en matchande resultattabell som visar de kluster som DQS har identifierat för den valda regeln. Tabellen visar varje post i klustret med mappningsdomänvärden och matchande poäng samt den första pivotposten för klustret. Du kan också visa profileringsdata för matchningsprocessen som helhet, villkoren i varje matchande regel och statistik för resultaten för varje matchande regel separat. Du kan filtrera på de huvudregeldata som du vill ha.
Mer information om hur matchningsregler fungerar finns i Ange matchande regelparametrar.
På sidan Matchningsprincip klickar du på ikonen Skapa en matchande regel.
Ange ett namn och en beskrivning för regeln.
Öka värdet på minsta matchningspoäng om du vill göra matchningskraven mer strikta. Mer information om minsta matchningspoäng finns i Ange matchande regelparametrar.
Klicka på ikonen Lägg till ett nytt domänelement.
Välj en domän eller en sammansatt domän att ange regelvärden för.
Not
Du kan bara välja en sammansatt domän om varje enskild domän i den sammansatta domänen har mappats till en källkolumn.
För Likhetväljer du Liknande om två värden i samma fält med två olika poster kan betraktas som en matchning även om de inte är identiska. Välj Exakt om två värden i samma fält i två olika poster måste vara identiska för att anses vara en matchning. (Mer information finns i Ange matchande regelparametrar.)
För Weightanger du ett värde som avgör hur en domäns matchande poäng bidrar till den övergripande matchningspoängen för två poster.
Not
När du definierar en vikt för en sammansatt domän kan du ange en annan vikt för varje enskild domän i den sammansatta domänen, i vilket fall den sammansatta domänen inte får en separat vikt, eller så kan du ange en enskild vikt för den sammansatta domänen, där de enskilda domänerna i den sammansatta domänen inte ges separata vikter.
Välj Krav för att ange att värdena för fältet i de två posterna måste returnera en 100% matchning, annars betraktas posterna inte som en matchning och de andra satserna i regeln ignoreras. Om Similaritet är liknandeändras den till Exaktoch vikten tas bort eftersom matchningen måste vara 100%%.
Upprepa steg 4 till och med 8 för alla andra domäner som ingår i matchningsregeln. Se till att summan av vikterna för alla domäner i regeln är lika med 100.
Välj Överlappande kluster från listrutan för att visa pivotposter och efterföljande poster för alla kluster när matchningen körs, även om grupper av kluster har gemensamma poster. Välj Kluster som inte överlappar varandra för att visa kluster som har poster gemensamt som ett enda kluster när matchningen körs.
Klicka på Läs in data från källan för att kopiera data från datakällan till mellanlagringstabellen och indexera om det när du kör matchningsprincipen. Klicka på Kör på tidigare data för att köra en matchande princip utan att kopiera data till mellanlagringstabellen och indexera om data. Kör på tidigare data är inaktiverad för den första körningen av matchningspolicyn, eller om du ändrar mappning på sidan Map och sedan trycker på Ja i det följande popup-fönstret. I båda dessa fall måste du indexeras om. Det är inte nödvändigt att indexera om ifall matchningsprincipen inte har ändrats. Att köra på tidigare data kan hjälpa prestanda.
Klicka på Starta för att köra matchningsprocessen för den valda regeln. När processen är klar visar tabellen kolumnerna Post-ID, Klusternummer och data (inklusive de som inte finns i matchningsregeln) för varje post i ett kluster. Pivot-raden i klustret betraktas som den främsta kandidaten för att överleva dedupliceringsprocessen. Varje ytterligare rad i ett kluster anses vara en dubblett; dess matchande poäng, jämfört med pivotposten, anges i resultattabellen. Klusternumret är samma som post-ID:t för pivotposten i klustret.
Du kan arbeta med data i tabellen Matchande resultat enligt följande:
I Filterväljer du Matchade för att visa alla matchade rader och deras poäng. Rader som inte betraktas som matchningar (som har en matchande poäng som är mindre än den minsta matchande poängen) visas inte i matchande resultattabell. Välj omatchade om du vill visa alla omatchade rader, inte matchade rader.
Välj en procentandel från rullgardinsmenyn procenti steg om 5. Alla rader med matchande poäng som är större än eller lika med den procentandelen visas i matchande resultattabell.
Om du dubbelklickar på en post i den matchande resultattabellen visar DQS ett matchningspoäng detaljer popup-fönster som visar pivotposten och källposten (och värdena i alla fält), poängen mellan dem och en detaljerad vy av postmatchningen. Detaljnivån visar värdena i varje fält i pivotposten och källposten, vilket gör det möjligt för dig att jämföra dessa. Den visar också hur mycket varje fält bidrar till det totala matchningsresultatet för de två posterna.
Visa statistiken i flikarna Profiler och Matchande resultat för att säkerställa att du uppnår de resultat du behöver. Mer information finns i Profiler och resultatflikarna.
Om regeln behöver ändras ändrar du den i regelredigeraren och klickar på Starta om.
Not
När den första analysen har slutförts förvandlas Starta-knappen till en Starta om-knapp. Om resultatet från den tidigare analysen inte har sparats ännu kommer du att förlora tidigare data genom att klicka på Starta om. När analysen körs lämnar du inte sidan, annars avslutas analysprocessen.
Fliken matchande resultat visar statistik för de senaste två körningarna av regeln. Om du har kört matchningsregeln mer än en gång med olika inställningar jämför du statistiken för den aktuella regeln och den tidigare regeln. Om du upptäcker att resultatet från den tidigare regeln var bättre klickar du på Återställ föregående regel för att återställa villkoren för den tidigare regeln och returnera regeln till dess tidigare tillstånd innan du redigerar den. De aktuella regelvillkoren går förlorade. Detta gör att du kan justera policyn baserat på de två senaste matchningskörningarna, vilket minskar den tid du lägger på att ställa in matchningspolicyn.
Om du vill att en annan regel ska läggas till i matchande princip upprepar du från steg 1.
Klicka på Nästa för att gå vidare till matchande resultatsteg.
Matchningsresultatfas
Du testar alla dina matchande regler samtidigt på sidan Matchande Resultat. Innan du gör det kan du ange att regeltestkörningen identifierar överlappande eller icke-överlappande kluster. Om du kör reglerna flera gånger kan du köra regeln på data som läses in från källan eller på tidigare data.
När du testar matchningsreglerna på sidan Matchande resultat visas en matchande resultattabell som visar de kluster som DQS har identifierat för alla regler. Tabellen visar varje post i klustret med mappningsdomänvärden och matchande poäng samt den första pivotposten för klustret. Du kan också visa profileringsdata för matchande regler som helhet, villkoren i varje matchande regel och statistik över resultaten för alla matchande regler.
På sidan Matchande resultat väljer du Överlappande kluster från listrutan för att visa pivotposter och följande poster för alla kluster när matchning körs, även om grupper av kluster har gemensamma poster. Välj Kluster som inte överlappar varandra för att visa kluster som har poster gemensamt som ett enda kluster när matchningen körs.
Klicka på Läs in data från källan för att kopiera data från datakällan till stagingtabellen och återindexera dem när du kör matchningsprincipen. Klicka på Kör på tidigare data för att köra en matchande policy utan att kopiera datan till mellanlagringstabellen och indexera om datan. Kör på tidigare data är inaktiverat för den första körningen av matchningspolicyn, eller om du ändrar mappning på sidan Kartläggning och sedan trycker på Ja i följande popup-fönster. I båda dessa fall måste du göra en ominindexering. Det är inte nödvändigt att indexera om matchningsprincipen inte har ändrats. Att köra på tidigare data kan hjälpa prestanda.
Klicka på Starta för att köra matchningsprocessen för alla regler som du har definierat. Tabellen Matchande resultat visar post-ID, klusternummer och datakolumner (inklusive de som inte finns i matchningsregeln) för varje post i ett kluster. Den ledande posten i klustret väljs slumpmässigt. (Du bestämmer den överlevande posten genom att välja överlevnadsregeln på sidan Exportera när du kör matchningsprojektet.) Varje ytterligare rad i ett kluster anses vara en dubblett; Dess matchande poäng (jämfört med pivotposten) anges i resultattabellen.
Du kan arbeta med data i tabellen Matchande resultat enligt följande:
I Filtreraväljer du Matchad för att visa alla matchade rader och deras poäng. Rader som inte betraktas som matchningar (som har en matchande poäng som är mindre än den minsta matchande poängen) visas inte i matchningsresultattabellen. Välj omatchade om du vill visa alla omatchade rader, inte matchade rader.
I rutan procentuell nedrullningsbar listaväljer du en procentandel från listan i steg om 5. Alla rader med matchande poäng som är större än eller lika med den procentandelen visas i matchande resultattabell.
Om du dubbelklickar på en post i den matchande resultattabellen visar DQS en matchande poänginformation popup-meny som visar pivotposten och källposten (och värdena i alla fält), poängen mellan dem och en ökad detaljnivå för postmatchningen. Djupgående analys visar värdena i varje fält i pivotposten och källposten så att du kan jämföra dem och visar matchningspoäng som varje fält bidrar till den övergripande matchningspoängen mellan de två posterna.
Visa statistiken i flikarna Profiler och Matchande resultat för att säkerställa att du uppnår de resultat du behöver. Klicka på fliken Matchningsregler för att se vilka domäninställningar för varje regel är. Mer information finns i Profiler och resultatflikar.
Om du inte är nöjd med resultatet av alla regler klickar du på Bakåt för att återgå till sidan matchningsprincip, ändrar en eller flera regler efter behov, går tillbaka till sidan matchande resultat och klickar sedan på Starta om.
Not
När analysen har slutförts omvandlas knappen Starta till en knappen Starta om. Om resultatet från den tidigare analysen inte har sparats ännu kommer du att förlora tidigare data genom att klicka på Starta om.
Om du är nöjd med resultaten av alla regler klickar du på Slutför för att slutföra policymatchningsprocessen och klickar sedan på ett av följande:
Ja – Publicera kunskapsbasen och avsluta: Kunskapsbasen publiceras för den aktuella användaren eller andra som ska användas. Kunskapsbasen låses inte. Kunskapsbasens tillstånd (i kunskapsbastabellen) kommer att vara tomt och både domänhanterings- och kunskapsidentifieringsaktiviteterna kommer att vara tillgängliga. Du kommer att återgå till skärmen Öppna kunskapsbas.
Nej – Spara arbetet på kunskapsbasen och avsluta: Ditt arbete sparas, kunskapsbasen förblir låst och kunskapsbasens tillstånd anges till I arbete. Både aktiviteterna Domänhantering och Kunskapsidentifiering är tillgängliga. Du kommer tillbaka till startsidan.
Avbryt – Stanna kvar på den aktuella skärmen: Popup-fönstret stängs och du kommer att återgå till skärmen Domänhantering.
Klicka på Stäng för att spara ditt arbete och gå tillbaka till DQS-startsidan. Tillståndet för kunskapsbasen visar strängen "Matchande policy – " samt det aktuella tillståndet. Om du klickade på Stäng när du befinner dig på skärmen Matchningsresultat visas tillståndet: "Matchningspolicy – resultat". Om du klickade stäng medan du befinner dig på skärmen Matchningsprincip, visas tillståndet: "Matchningsprincip – Matchningsprincip". När du har klickat på Stäng, för att utföra aktiviteten Knowledge Discovery, måste du gå tillbaka till Matchningspolicy-aktiviteten, klicka på Slutför, och sedan klicka på antingen Ja för att publicera kunskapsbasen eller Nej för att spara arbetet på kunskapsbasen och avsluta.
Anteckning
Om du klickar på Stäng medan en matchningsprocess körs avslutas inte matchningsprocessen när du klickar på Stäng. Du kan öppna kunskapsbasen igen och antingen se att processen fortfarande körs eller att resultatet visas om det har slutförts. Om processen inte har slutförts visas förloppet på skärmen.
Klicka på Avbryt för att avsluta aktiviteten Matchande princip, förlora ditt arbete och återgå till startsidan för DQS.
Följ upp: Efter att ha skapat en matchande policy
När du har skapat en matchningspolicy kan du köra ett matchningsprojekt baserat på kunskapsbasen som innehåller matchningspolicyn. Mer information finns i Köra ett matchande projekt.
Profilerings- och resultatflikar
Fliken Profiler och resultat innehåller statistik för sidorna Matchningsprincip och Matchande resultat.
Fliken Profiler
Klicka på fliken Profiler för att visa statistik för källdatabasen och för varje fält som ingår i principregeln. Statistiken uppdateras allt eftersom principregeln körs.
Mer information om hur du tolkar följande statistik finns i Ange matchande regelparametrar.
Källdatabasstatistiken innehåller följande:
Rekord: Det totala antalet rekord i källdatabasen
Totalt antal värden: Det totala antalet värden i datakällans fält
Nya värden: Det totala antalet värden som är nya sedan föregående körning och deras procentandel av hela
unika värden: Det totala antalet unika värden i fälten och deras procentandel av hela
Nya unika värden: Det totala antalet unika värden som är nya i fälten och deras procentandel av hela
Fältstatistiken innehåller följande:
Fältnamn
Domännamn
Ny: Antalet nya värden och procentandelen nya värden jämfört med befintliga värden i domänen
Unikt: Antalet unika poster i fältet och deras procentandel av totalsumman
Fullständighet: Fullständigheten för varje källfält som mappas för matchande övning
Matchande policymeddelanden
För matchande principaktivitet resulterar följande villkor i meddelanden:
Fältet är tomt i alla poster. Vi rekommenderar att du eliminerar den från mappningen.
Fältets fullständighetspoäng är mycket låg; du kanske vill ta bort den från mappningen.
Alla värden i ett fält är ogiltiga. du bör kontrollera mappningen och relevansen för domänreglerna för fältinnehållet.
Det finns en låg nivå av giltiga värden i fältet. du bör kontrollera mappningen och relevansen för domänreglerna för fältinnehållet.
Det finns en hög unikhetsnivå i det här fältet. Om du använder det här fältet i matchningsprincip kan matchningsresultaten minska.
Fliken Matchande resultat
Klicka på fliken Matchande resultat för att visa statistik för matchande principregelkörning och föregående regelkörning. Om du har kört samma regel mer än en gång med olika parametrar visar den matchande resultattabellen statistik för båda körningarna, så att du kan jämföra dem. Du kan också återställa den tidigare regeln om du vill.
Statistiken innehåller följande:
Det totala antalet poster i databasen
Det totala antalet matchande poster i databasen
Antalet poster i databasen som inte anses vara dubbletter
Antalet identifierade kluster
Den genomsnittliga klusterstorleken (antalet duplicerade poster dividerat med antalet kluster)
Det minsta antalet dubbletter i ett kluster
Det största antalet dubbletter i ett kluster