Vytvoření odpovídajících zásad
platí pro:SQL Server
Toto téma popisuje, jak vytvořit odpovídající zásady ve znalostní bázi ve službě Data Quality Services (DQS). Připravíte se na proces párování v DQS spuštěním aktivity Politika párování na ukázkových datech. V této aktivitě vytvoříte a otestujete jedno nebo více odpovídajících pravidel v zásadách a pak publikujete znalostní bázi, aby byla odpovídající pravidla veřejně dostupná pro použití. Ve znalostní bázi může existovat pouze jedna odpovídající zásada, ale tato zásada může obsahovat více odpovídajících pravidel.
Vytvoření odpovídající zásady se provádí ve třech fázích: proces mapování, ve kterém identifikujete zdroj dat a mapujete domény na sloupce, odpovídající proces zásad, ve kterém vytvoříte jedno nebo více odpovídajících pravidel a otestujete každé odpovídající pravidlo samostatně, a proces odpovídajících výsledků, ve kterém spustíte všechna odpovídající pravidla společně, a pokud s nimi budete spokojeni, přidejte zásadu do znalostní báze. Každý z těchto procesů se provádí na samostatné stránce průvodce aktivitou Odpovídající zásady, což umožňuje přecházet mezi různými stránkami, znovu spustit proces a zavřít konkrétní proces odpovídající zásady a vrátit se do stejné fáze procesu. Po otestování všech pravidel se v případě potřeby můžete vrátit na stránku Pravidla pro shodu, upravit určité pravidlo, znovu jej otestovat samostatně a pak se vrátit na stránku Výsledky shody a spustit všechna pravidla znovu. DQS poskytuje statistiky o zdrojových datech, odpovídajících pravidlech a odpovídajících výsledcích, které vám umožní činit informovaná rozhodnutí o odpovídajících zásadách, abyste je mohli upřesnit.
Než začnete
Požadavky
Pokud jsou zdrojová data v excelovém souboru, musí být v počítači klienta kvality dat nainstalována aplikace Microsoft Excel. Jinak nebudete moct vybrat excelové soubory ve fázi mapování. Soubory vytvořené aplikací Microsoft Excel mohou mít příponu .xlsx, .xlsnebo .csv. Pokud se používá 64bitová verze Aplikace Excel, jsou podporovány pouze soubory aplikace Excel 2003 (.xls). Soubory Excelu 2007 nebo 2010 (.xlsx) nejsou podporované. Pokud používáte 64bitovou verzi Excelu 2007 nebo 2010, uložte soubor jako soubor .xls nebo .csv nebo nainstalujte 32bitovou verzi Excelu.
Bezpečnost
Dovolení
K vytvoření odpovídající zásady musíte mít dqs_kb_editor nebo roli dqs_administrator v databázi DQS_MAIN.
Jak nastavit odpovídající parametry pravidla
Vytvoření odpovídajícího pravidla je iterativní proces, ve kterém zadáte faktory použité k určení, jestli je jeden záznam shoda pro jiný. V tabulce můžete zadat podmínky pro libovolnou doménu. Když DQS provádí porovnávání se dvěma záznamy, porovná hodnoty v polích namapovaných na domény, které jsou součástí odpovídajícího pravidla. DQS analyzuje hodnoty v jednotlivých polích pravidla a pak použije faktory zadané v pravidle pro každou doménu k výpočtu konečného odpovídajícího skóre. Pokud je porovnávací skóre pro tyto dva záznamy větší než minimální odpovídající skóre, považují se tato dvě pole za shodná.
Mezi faktory, které zadáte do odpovídajícího pravidla, patří:
Váha: Pro každou doménu v pravidle zadejte číselnou váhu, která určuje, jak se bude porovnávaná analýza domény porovnávat s danou doménou v pravidle. Váha označuje příspěvek skóre pole k celkovému odpovídajícímu skóre mezi dvěma záznamy. Počítané skóre přiřazené každému zdrojovému poli se sečtou dohromady pro složené odpovídající skóre pro oba záznamy. Pro každé pole, které není předpokladem a má přesnou nebo podobnou podobnost, nastavte váhu mezi 10 a 100. Součet váhy domén, které nejsou požadavky, musí být rovna 100. Pokud je hodnota předpokladem, je váha nastavená na 0 a nelze ji změnit.
Podobnost přesných hodnot: Vyberte Přesné, pokud mají být hodnoty ve stejném poli dvou různých záznamů identické, aby se považovaly za shodu. Pokud je stejné, bude odpovídající skóre pro danou doménu nastaveno na 100 a DQS použije toto skóre a skóre pro ostatní domény v pravidle k určení agregovaného odpovídajícího skóre. Pokud není stejné, bude odpovídající skóre pro danou doménu nastaveno na hodnotu 0 a zpracování pravidla bude pokračovat k další podmínce. Pokud nastavíte odpovídající pravidlo pro číselnou doménu a vyberete Podobné, můžete zadat toleranci buď jako procento, nebo celé číslo. Pro doménu typu datum můžete zadat tolerance jako den, měsíc nebo rok (celé číslo), pokud vyberete Podobné; pro doménu kalendářního data neexistuje žádná procentuální tolerance. Pokud vyberete Přesně, tato možnost není dostupná.
Podobnost podobných: Vyberte Podobné, pokud dvě hodnoty ve stejném poli dvou různých záznamů mohou být považovány za shodu, i když tyto hodnoty nejsou stejné. Když DQS spustí pravidlo, vypočítá odpovídající skóre pro danou doménu a použije toto skóre a skóre pro ostatní domény v pravidle k určení agregovaného odpovídajícího skóre. Minimální podobnost mezi hodnotami pole je 60%. Pokud je počítané odpovídající skóre pro pole dvou záznamů menší než 60, je skóre podobnosti automaticky nastaveno na hodnotu 0. Pokud nastavujete odpovídající pravidlo pro číselné pole a vyberete Podobné, můžete zadat toleranci jako procento nebo celé číslo. Pokud nastavujete odpovídající pravidlo pro pole kalendářního data a vyberete Podobné, můžete zadat číselnou toleranci.
Předpoklad: Vyberte Podmínku, aby bylo jasné, že hodnoty ve stejném poli ve dvou různých záznamech musí dosáhnout 100% shody, jinak se záznamy nepovažují za shodu a ostatní klauzule v pravidle se ignorují. Pokud je vybrána Prerekvizita, pole hmotnosti pro doménu se odebere, abyste pro ni nemohli definovat hmotnost. Musíte resetovat jednu nebo více váhy domény, aby se součet hmotností rovnal 100. Předběžné domény nepřispívají k hodnocení pro porovnání záznamů. Skóre porovnávání záznamů je určeno porovnáním hodnot v polích, pro která je podobnost nastavena na Podobné nebo Přesné. Když nastavíte pole jako předpoklad, podobnost pro danou doménu se automaticky nastaví na Přesnou.
Minimální shodné skóre je prahová hodnota, u které jsou dva záznamy považovány za shodu (a stav záznamů je nastaven na "Spárováno"). Zadejte celočíselnou hodnotu v přírůstcích po "1" nebo kliknutím na šipku nahoru nebo dolů zvyšte nebo snižte hodnotu v přírůstcích po 10. Minimální hodnota je 80. Pokud je shodné skóre nižší než 80, dva záznamy se nepovažují za shodu. Na této stránce nelze změnit rozsah minimálního odpovídajícího skóre. Nejnižší minimální požadované skóre je 80. Můžete ale změnit nejnižší minimální odpovídající skóre na stránce Správa (pokud jste správceM DQS).
Vytvoření odpovídajícího pravidla je iterativní proces, protože možná budete muset změnit relativní váhy domén v pravidle, nebo podobnost nebo požadovanou vlastnost pro doménu nebo minimální skóre pro pravidlo, aby bylo možné dosáhnout požadovaných výsledků. Můžete také zjistit, že potřebujete vytvořit více pravidel, z nichž každá se spustí, aby se vytvořilo odpovídající skóre. Může být obtížné dosáhnout výsledku, který potřebujete jenom s jedním pravidlem. Několik pravidel bude poskytovat různá zobrazení požadované shody. S více pravidly můžete do každého pravidla zahrnout méně domén, použít vyšší váhy pro každou doménu a dosáhnout lepších výsledků. Pokud jsou data méně přesná a méně úplná, možná budete potřebovat více pravidel k vyhledání požadovaných shod. Pokud jsou data přesnější a dokončená, potřebujete méně pravidel.
Profilace poskytuje přehled o úplnosti a jedinečnosti. Zvažte úplnost a jedinečnost v kombinaci. Pomocí údajů o úplnosti a jedinečnosti určete, jakou váhu přidělit poli v procesu porovnávání. Pokud je v poli vysoká úroveň jedinečnosti, může použití pole v odpovídající zásadě snížit odpovídající výsledky, takže můžete chtít nastavit váhu pro toto pole na relativně malou hodnotu. Pokud máte nízkou úroveň jedinečnosti pro sloupec, ale nízkou úplnost, možná nebudete chtít zahrnout doménu pro tento sloupec. S nízkou úrovní jedinečnosti, ale vysokou úrovní úplnosti, můžete chtít zahrnout doménu. Některé sloupce, například pohlaví, můžou mít přirozeně nízkou úroveň jedinečnosti. Další informace naleznete v tématu profiler a karty s výsledky.
První krok: Zahájení shodné politiky
Provedete aktivitu pro párování zásad v oblasti správy znalostní báze v aplikaci Data Quality Client.
Spusťte klienta kvality dat. Informace o tom najdete v tématu Spuštění klientské aplikace pro kvalitu dat.
Na domovské obrazovce Klienta kvality dat klikněte na Nová znalostní báze a vytvořte v nové znalostní bázi odpovídající zásady. Zadejte název znalostní báze, zadejte popis a nastavte Vytvořit znalostní bázi z podle potřeby. Klikněte na odpovídající zásady aktivity. Pro pokračování klikněte na Další.
Kliknutím na Otevřít znalostní bázi vytvořte nebo upravte odpovídající zásady ve stávající znalostní bázi. Vyberte znalostní bázi, vyberte odpovídající zásadya potom klikněte na Další. Také můžete kliknout na znalostní bázi v sekci Nedávné znalostní báze. Pokud otevřete znalostní bázi, která byla uzavřena během práce na shodné politice, budete pokračovat ve fázi, ve které byla aktivita této politiky uzavřena. To je indikováno buď ve sloupci State znalostní báze v tabulce znalostní báze, nebo v názvu znalostní báze části Poslední znalostní báze. Pokud otevřete znalostní bázi, která obsahuje slučovací zásady a byla dokončena, přejdete na stránku Slučovací zásady. Pokud otevřete znalostní bázi, která neobsahuje odpovídající zásady a byla dokončena, přejdete na stránku Mapování.
Fáze mapování
Ve fázi mapování identifikujete zdroj dat, pro která vytvoříte odpovídající zásady, a namapujete zdrojové sloupce na domény, aby byly domény dostupné pro odpovídající aktivitu zásad.
Na stránce Mapa vytvořte politiku pro databázi, ponechte Zdroj dat jako SQL Server, vyberte databázi, pro kterou chcete vytvořit politiku v Database, a poté vyberte tabulku nebo zobrazení v Tabulka/Zobrazení. Zdrojová databáze musí být ve stejné instanci SQL Serveru jako Server pro kvalitu dat. Jinak se nezobrazí v rozevíracím seznamu.
Pokud chcete vytvořit zásadu pro data v Excelové tabulce, vyberte Excelový soubor pro zdroj dat, klikněte na Procházet, vyberte soubor a ponechte Použít první řádek jako záhlaví zaškrtnuté podle potřeby. V listuvyberte list v excelovém souboru, který bude zdrojem dat. Aby bylo možné vybrat excelový soubor, musí být v počítači klienta kvality dat nainstalována aplikace Microsoft Excel. Jinak tlačítko Procházet nebude k dispozici a pod tímto textovým polem budete upozorněni, že aplikace Microsoft Excel není nainstalována.
V části Mapovánívyberte pole pro Zdrojový sloupeca potom klikněte na ikonu Vytvoření domény.
V sekci Mapovánívyberte pole ve zdroji dat pro zdrojový sloupeca pak vyberte odpovídající doménu. Opakujte pro všechny domény, které používáte v odpovídajícím procesu. Podle potřeby vytvořte doménu kliknutím na Vytvořit doménu nebo Vytvořit složenou doménu.
Poznámka
Zdrojová data můžete mapovat na doménu DQS při vytváření odpovídajících zásad pouze v případě, že je zdrojový datový typ podporovaný v DQS a odpovídá datovému typu domény DQS. Informace o podporovaných datových typech v DQS naleznete v tématu Podporované sql Server a datové typy SSIS pro domény DQS.
Kliknutím na ovládací prvek plus (+) přidáte řádek do tabulky Mapování nebo kliknutím na ovládací prvek minus (-) odeberete řádek.
Kliknutím na Náhled zdroje dat zobrazíte data v tabulce nebo zobrazení SQL Serveru, které jste vybrali, nebo na listu aplikace Excel, který jste vybrali.
Kliknutím na Zobrazit nebo vybrat složené domény zobrazíte seznam složených domén dostupných ve znalostní bázi a vyberete podle potřeby mapování.
Kliknutím na Další přejděte do odpovídající fáze zásad.
Poznámka
Kliknutím na Zavřít uložte fázi odpovídajícího projektu a vraťte se na domovskou stránku DQS. Při příštím otevření tohoto projektu začne ze stejné fáze. Kliknutím na Zrušit ukončete odpovídající aktivitu, ztratíte práci a vrátíte se na domovskou stránku DQS.
Odpovídající fáze zásad
Vytvoříte odpovídající pravidla a otestujete je jednotlivě na stránce Odpovídající zásady. Když testujete odpovídající pravidlo na stránce Odpovídající zásady, zobrazí se odpovídající tabulka výsledků, která zobrazuje clustery, které DQS identifikoval pro vybrané pravidlo. Tabulka zobrazuje každý záznam v clusteru s mapováním hodnot domény a odpovídajícím skóre a počátečním kontingenčním záznamem clusteru. Můžete také zobrazit profilovací data pro shodující proces jako celek, podmínky v každém shodujícím pravidle a statistiky výsledků pro každé shodující pravidlo zvlášť. Můžete filtrovat data hlavního pravidla, která chcete.
Další informace o tom, jak fungují odpovídající pravidla, naleznete v tématu Jak nastavit odpovídající parametry pravidla.
Na stránce Politika shody klikněte na ikonu Vytvořit odpovídající pravidlo.
Zadejte název a popis pravidla.
Zvyšte hodnotu minimálního odpovídajícího skóre, pokud chcete, aby požadavky na shodu byly přísnější. Další informace o minimálním skóre shody naleznete v tématu Jak nastavit odpovídající parametry pravidla.
Klikněte na ikonu Přidat nový prvek domény.
Vyberte doménu nebo složenou doménu a zadejte hodnoty pravidel pro.
Poznámka
Složenou doménu můžete vybrat jenom v případě, že každá doména ve složené doméně byla namapována na zdrojový sloupec.
U podobnostivyberte Podobné, pokud lze dvě hodnoty ve stejném poli dvou různých záznamů považovat za shodu, i když nejsou totožné. Vyberte Přesnou, pokud musí být dvě hodnoty ve stejném poli dvou různých záznamů stejné, aby se považovaly za shodu. (Další informace najdete v tématu Nastavení odpovídajících parametrů pravidla.)
Pro Weightzadejte hodnotu, která určuje příspěvek odpovídajícího skóre domény k celkovému odpovídajícímu skóre pro dva záznamy.
Poznámka
Když definujete váhu složené domény, můžete zadat jinou váhu pro každou jednu doménu ve složené doméně, v takovém případě složená doména není udělena samostatná váha, nebo můžete zadat jednu váhou složené domény, ve které jednotlivé domény ve složené doméně nejsou uděleny samostatné váhy.
Vyberte Předpoklad k určení, že hodnoty pro pole ve dvou záznamech musí vrátit 100% shodu%, jinak se záznamy nepovažují za shodné a ostatní klauzule v pravidle budou ignorovány. Pokud je podobnost podobná , změní se na přesnáa váha bude odstraněna, protože shoda musí být 100%.
Opakujte kroky 4 až 8 pro všechny ostatní domény, které budou součástí odpovídajícího pravidla. Ujistěte se, že se součet váhy pro všechny domény v pravidle rovná 100.
V rozevíracím seznamu vyberte Překrývající se clustery, aby se při provádění shody zobrazily kontingenční záznamy a následující záznamy pro všechny clustery, a to i v případě, že skupiny clusterů mají společné záznamy. Vyberte Nepřekrývající se clustery, aby se při provádění párování zobrazily clustery, které mají společné záznamy jako jeden cluster.
Klikněte na Znovu načíst data ze zdroje, abyste zkopírovali data ze zdroje dat do pracovní tabulky a znovu je indexovali při spuštění zásady shody. Kliknutím na Spustit pro předchozí data spusťte odpovídající funkci bez nutnosti kopírování dat do pracovní tabulky a jejich opětovného indexování. Provést u předchozích dat je při prvním spuštění odpovídající zásady zakázáno, nebo pokud změníte mapování na stránce Map a potom v následujícím automaticky otevírané nabídce stiskněte Ano. V obou těchto případech musíte znovu indexovat. Pokud se odpovídající zásada nezměnila, není nutné znovu indexovat. Využití předchozích dat může pomoci zlepšit výkon.
Klikněte na tlačítko Spustit a spusťte srovnávací proces pro vybrané pravidlo. Po dokončení procesu se v tabulce zobrazí ID záznamu, číslo clusteru a datové sloupce (včetně těch, které nejsou v odpovídajícím pravidle) pro každý záznam v clusteru. Výběrový řádek v clusteru se považuje za hlavního kandidáta, který přečká proces odstranění duplicit. Každý další řádek v clusteru se považuje za duplicitní; v tabulce výsledků je k dispozici odpovídající skóre (ve srovnání s kontingenčním záznamem). Číslo clusteru je stejné jako ID záznamu pro hlavní záznam v clusteru.
S daty v tabulce Výsledky Odpovídající můžete pracovat následujícím způsobem:
V Filtruvyberte spárované, aby se zobrazily všechny odpovídající řádky a jejich skóre. Řádky, které nejsou považovány za shody (které mají skóre shody menší než minimální skóre shody), se v tabulce výsledků shod nezobrazují. Pokud chcete zobrazit všechny řádky, které nejsou odpovídající, vyberte chybějící.
V rozevíracím poli procent vyberte procento ze seznamu v krocích po 5. Všechny řádky s odpovídajícím skóre, které je větší nebo rovno dané procento, se zobrazí v tabulce s odpovídajícími výsledky.
Pokud dvakrát kliknete na záznam v odpovídající tabulce výsledků, zobrazí DQS podrobnosti o skóre shody automaticky otevírané okno zobrazující záznam kontingenčního záznamu a zdrojového záznamu (a hodnoty ve všech polích), skóre mezi nimi a přechod k podrobnostem odpovídajícího záznamu. Detailní zobrazení ukáže hodnoty v každém poli kontingenčního záznamu a zdrojového záznamu, abyste je mohli porovnat, a zobrazí shodné skóre, kterým každé pole přispívá k celkovému shodnému skóre pro oba záznamy.
Podívejte se na statistiky na kartách Profiler a Odpovídající výsledky, abyste dosáhli požadovaných výsledků. Další informace naleznete v tématu Profiler a záložky Výsledky.
Pokud je potřeba pravidlo změnit, změňte ho v Editoru pravidel a klikněte na Restartovat.
Poznámka
Po dokončení první analýzy se tlačítko Start změní na tlačítko Restartovat. Pokud výsledky z předchozí analýzy ještě nebyly uloženy, kliknutí na Restart povede ke ztrátě těchto dat. Při spuštění analýzy neopusťte stránku nebo proces analýzy se ukončí.
Na kartě Odpovídající výsledky se zobrazují statistiky pro poslední dva spuštění pravidla. Pokud jste s různými nastaveními spustili odpovídající pravidlo více než jednou, porovnejte statistiky pro aktuální pravidlo a předchozí pravidlo. Pokud zjistíte, že výsledky z předchozího pravidla byly lepší, klikněte na Obnovit předchozí pravidlo a obnovte podmínky předchozího pravidla tak, že před úpravami vrátíte pravidlo do předchozího stavu. Aktuální podmínky pravidla budou ztraceny. To vám umožní ladit zásady na základě posledních dvou odpovídajících spuštění a snížit čas strávený laděním odpovídajících zásad.
Pokud chcete do odpovídajících zásad přidat další pravidlo, opakujte ho z kroku 1.
Kliknutím na Další přejděte do fáze s odpovídajícími výsledky.
Fáze porovnávání výsledků
Otestujte všechna svá odpovídající pravidla najednou na stránce Odpovídající výsledky. Než to uděláte, můžete určit, že testovací běh pravidla identifikuje překrývající se nebo nepřekrývající se clustery. Pokud pravidla spouštíte několikrát, můžete pravidlo spouštět na datech znovu načtených ze zdroje nebo z předchozích dat.
Když testujete odpovídající pravidla na stránce Odpovídající výsledky, zobrazí se odpovídající tabulka výsledků, která zobrazuje clustery, které DQS identifikoval pro všechna pravidla. Tabulka zobrazuje každý záznam v clusteru s mapováním hodnot domény a odpovídajícím skóre a počátečním kontingenčním záznamem clusteru. Můžete také zobrazit profilace pro odpovídající pravidla jako celek, podmínky v každém odpovídajícím pravidlu a statistiky výsledků pro všechna odpovídající pravidla.
Na stránce Odpovídající výsledky vyberte Překrývající se clustery z rozevíracího seznamu, aby se zobrazily kontingenční záznamy a následující záznamy pro všechny clustery při provádění shody, a to i v případě, že skupiny clusterů mají společné záznamy. Vyberte Nepřekrývající se clustery, aby se při provádění párování zobrazily clustery, které mají společné záznamy jako jeden cluster.
Kliknutím na Znovu načíst data ze zdroje zkopírujte data ze zdroje dat do pracovní tabulky a přeindexujte je při spuštění zásady porovnávání. Kliknutím na Spustit u předchozích dat spusťte odpovídající zásady bez zkopírování dat do pracovní tabulky a opětovného indexování dat. Provést u předchozích dat je zakázáno při prvním spuštění zásady párování, nebo pokud změníte mapování na stránce Map, a potom v následujícím automaticky otevíraném okně stisknete Ano. V obou těchto případech musíte přeuspořádat indexy. Pokud se odpovídající zásada nezměnila, není nutné znovu indexovat. Zpracování předchozích dat může zlepšit výkon.
Kliknutím na Start spusťte proces párování pro všechna pravidla, která jste definovali. Tabulka Odpovídající výsledky zobrazuje ID záznamu, číslo clusteru a datové sloupce (včetně těch, které nejsou v odpovídajícím pravidle) pro každý záznam v clusteru. Počáteční záznam v clusteru je vybrán náhodně. (Záznam o přežití určíte tak, že vyberete pravidlo přeživšího na stránce Export při spuštění odpovídajícího projektu.) Každý další řádek v clusteru se považuje za duplicitní; v tabulce výsledků je k dispozici odpovídající skóre (ve srovnání s kontingenčním záznamem).
S daty v tabulce Výsledky shody můžete pracovat následujícím způsobem:
V Filtrvyberte Spárované, aby se zobrazily všechny odpovídající řádky a jejich skóre. Řádky, které nejsou považovány za shody (které mají skóre menší než minimální skóre shody), se v tabulce výsledků shody nezobrazují. Pro zobrazení všech neodpovídajících řádků vyberte Neodpovídající.
V rozevíracím seznamu procent vyberte procento z rozevíracího seznamu po 5%. Všechny řádky s odpovídajícím skóre, které je větší nebo rovno dané procento, se zobrazí v tabulce s odpovídajícími výsledky.
Pokud dvakrát kliknete na záznam v odpovídající tabulce výsledků, zobrazí DQS podrobnosti o skóre shody automaticky otevírané okno zobrazující záznam kontingenčního záznamu a zdrojového záznamu (a hodnoty ve všech polích), skóre mezi nimi a přechod k podrobnostem odpovídajícího záznamu. Rozevírací analýza zobrazí hodnoty v každém poli kontingenčního záznamu i zdrojového záznamu, abyste je mohli porovnat, a ukáže skóre shody, které každé pole přispívá k celkovému skóre shody pro oba záznamy.
Zobrazte statistiky na kartách Profiler a Porovnání výsledků, abyste se ujistili, že dosahujete požadovaných výsledků. Kliknutím na kartu Odpovídající pravidla zobrazíte nastavení domény pro každé pravidlo. Další informace viz Profiler a karty Výsledky.
Pokud nejste spokojení s výsledky všech pravidel, klikněte na tlačítko Zpět se vraťte na stránku Odpovídající zásady, podle potřeby upravte jedno nebo více pravidel, vraťte se na stránku Odpovídající výsledky a potom klikněte na tlačítko Restartovat.
Poznámka
Po dokončení analýzy se tlačítko Start změní na tlačítko Restartovat. Pokud se výsledky z předchozí analýzy ještě neuložily, kliknutí na Restart způsobí, že předchozí data budou ztracena.
Pokud jste spokojeni s výsledky všech pravidel, klikněte na Dokončit a dokončete proces sladění zásad a poté klikněte na jednu z následujících možností:
Ano – Publikujte znalostní bázi a ukončete: Znalostní báze bude publikovaná pro aktuálního uživatele nebo jiné uživatele, kteří ho budou používat. Znalostní báze nebude uzamčena, stav znalostní báze (v tabulce znalostní báze) bude nastaven na prázdný a aktivity Domain Management a Knowledge Discovery budou k dispozici. Vrátíte se na obrazovku Open Knowledge Base.
Ne – Uložte práci na znalostní bázi a ukončete: Vaše práce bude uložena, znalostní báze zůstane zamknutá a stav znalostní báze bude nastaven na V práci. Budou k dispozici aktivity Správy domény i zjišťování znalostí. Vrátíte se na domovskou stránku.
Zrušit – Zůstane na aktuální obrazovce: Automaticky otevírané okno se zavře a vrátíte se na obrazovku Správa domény.
Kliknutím na Zavřít uložte práci a vraťte se na domovskou stránku DQS. Stav znalostní báze zobrazí řetězec "Odpovídající zásady – " a aktuální stav. Pokud jste klikli na Zavřít, když jste na obrazovce Porovnání výsledků, zobrazí se stav: "Porovnávání zásad – výsledky". Pokud jste klikli na tlačítko Zavřít, když jste na obrazovce Politika sladění, stav se zobrazí jako: Politika sladění – Politika sladění. Po kliknutí na Zavřít, chcete-li provést aktivitu zjišťování znalostí, budete se muset vrátit do aktivity Odpovídající zásady, klepněte na tlačítko Dokončita potom klikněte na Ano publikovat znalostní bázi nebo Ne uložit práci na znalostní bázi a ukončit.
Poznámka
Pokud kliknete na Zavřít, když je spuštěn odpovídající proces, odpovídající proces se neukončí, když kliknete na Zavřít. Znalostní bázi můžete znovu otevřít a zjistit, jestli je proces stále spuštěný, nebo pokud je dokončený, zobrazí se výsledky. Pokud se proces nedokončil, obrazovka zobrazí průběh.
Kliknutím na Zrušit ukončíte aktivitu shody zásad, čímž ztratíte svou práci, a vrátíte se na domovskou stránku DQS.
Následné kroky: Po vytvoření odpovídající zásady
Po vytvoření odpovídající zásady můžete spustit odpovídající projekt založený na znalostní bázi, která obsahuje odpovídající zásady. Další informace najdete v tématu Provádění odpovídajícího projektu.
Karta profileru a výsledky
Karta Profiler a Výsledky obsahuje statistiky pro stránky Odpovídající zásady a Odpovídající výsledky.
Karta profileru
Kliknutím na kartu Profiler se zobrazí statistiky pro zdrojovou databázi a pro každé pole v pravidle zásad. Statistiky se aktualizují při spuštění pravidla zásad.
Další informace o tom, jak interpretovat následující statistiky, naleznete v tématu Jak nastavit odpovídající parametry pravidla.
Statistika zdrojové databáze zahrnuje následující:
záznamy: Celkový počet záznamů ve zdrojové databázi
celkový počet hodnot: Celkový počet hodnot v polích zdroje dat
nové hodnoty: Celkový počet hodnot, které jsou od předchozího spuštění nové, a jejich procento celku
jedinečné hodnoty: Celkový počet jedinečných hodnot v polích a jejich procento celku
nové jedinečné hodnoty: Celkový počet jedinečných hodnot, které jsou v polích nové, a jejich procento celku
Statistiky polí zahrnují následující:
Název pole
název domény
Nový: Počet nových hodnot a procent nových hodnot ve srovnání s existujícími hodnotami v doméně
Jedinečné: Počet jedinečných záznamů v poli a jejich procento z celkového počtu
Úplnost: Úplnost každého zdrojového pole, které je mapováno pro srovnávací úlohu
Oznámení o slučování zásad
U odpovídající aktivity zásad mají následující podmínky za následek oznámení:
Pole je prázdné ve všech záznamech; doporučuje se ho odstranit z mapování.
Skóre úplnosti pole je velmi nízké; Možná ho budete chtít odstranit z mapování.
Všechny hodnoty v poli jsou neplatné; měli byste ověřit mapování a relevantnost pravidel domény pro obsah pole.
V poli je malé množství platných hodnot; měli byste ověřit mapování a relevantnost doménových pravidel v obsahu pole.
V tomto poli je vysoká úroveň jedinečnosti. Použití tohoto pole v politice shody může snížit výsledky shody.
Karta Výsledků shody
Kliknutím na kartu Odpovídající výsledky zobrazíte statistiky pro spuštění odpovídajícího pravidla zásad a pro předchozí spuštění pravidla. Pokud jste stejné pravidlo spustili více než jednou s různými parametry, v tabulce s výsledky se zobrazí statistiky pro obě spuštění, což vám umožní je porovnat. Pokud chcete, můžete předchozí pravidlo obnovit.
Statistiky zahrnují následující:
Celkový počet záznamů v databázi
Celkový počet odpovídajících záznamů v databázi
Počet záznamů v databázi, které nejsou považovány za duplicity
Počet zjištěných clusterů
Průměrná velikost clusteru (počet duplicitních záznamů vydělený počtem clusterů)
Nejmenší počet duplicit v clusteru
Největší počet duplicit v clusteru