Nastavení vlastností domény
platí pro:SQL Server
Toto téma popisuje, jak nastavit vlastnosti domény ve službě Data Quality Services (DQS).
Než začnete
Požadavky
Pokud chcete nastavit vlastnosti domény, musíte mít vytvořenou znalostní bázi a doménu.
Bezpečnost
Dovolení
K nastavení vlastností v doméně musíte mít dqs_kb_editor nebo roli dqs_administrator v databázi DQS_MAIN.
Nastavení vlastností domény
Nastavte vlastnosti existující domény otevřením znalostní báze v aktivitě Domain Management (viz Otevřeníznalostní báze) a následným výběrem příslušné domény v seznamu Doména. Ve výchozím nastavení se zobrazí stránka Vlastnosti domény.
Po vytvoření nastavte vlastnosti nové domény, jak je popsáno v tématu Vytvořenídomény .
Kliknutím na Dokončit dokončete aktivitu správy domény, jak je popsáno v Ukončit aktivitu správy domény.
Pokračování: Po nastavení vlastností domény
Po nastavení vlastností domény můžete provádět další úlohy správy domény v doméně, můžete provádět zjišťování znalostí pro přidání znalostí do domény nebo můžete do domény přidat odpovídající zásady. Další informace najdete v tématu Prováděnízjišťování znalostí , Správadomény nebo Vytvoření odpovídajících zásad.
Vlastnosti domény
Název a popis domény
Po vytvoření domény je možné změnit název nebo popis domény. Název domény musí být jedinečný pro znalostní bázi. Popis může mít maximálně 256 znaků.
Datový typ
Při vytváření domény vyberte jeden z následujících datových typů pro hodnoty v doméně: Řetězcová (výchozí), Date, Integernebo Decimal. Po vytvoření domény můžete zobrazit datový typ, ale nemůžete ho změnit. Datový typ vybraný pro doménu definuje typ zdrojových dat, která lze mapovat na doménu. Informace o podporovaných datových typech pro každý ze čtyř datových typů domén v DQS najdete v části Podporované typy dat SQL Server a SSIS pro domény DQS.
Použití úvodních hodnot
Toto políčko zaškrtněte, pokud chcete určit, že úvodní hodnota ve skupině synonym bude výstupem místo hodnoty, která je pro ni synonymem. Zrušte výběr Použít počáteční hodnoty k určení, že každá hodnota synonyma je výstupem ve správné nebo opravené podobě a není nahrazena hlavní hodnotou pro její skupinu.
Normalizovat řetězec
Pokud je datový typ String, kliknutím můžete ignorovat speciální znaky ve zdrojových datech pro zpracování kvality dat pomocí DQS. DQS interně nahrazuje speciální znaky hodnotou null nebo mezerou při načtení dat do domény. Dvojtečka, spojovník, tečka, dvojitá uvozovka nebo středník se nahradí mezerou. Jedna uvozovka se nahradí prázdnou hodnotou. Použití hodnoty null spojí dvě části řetězce dohromady.
Ignorování speciálních znaků v řetězcové hodnotě může zvýšit přesnost porovnávání. Skóre podobnosti mezi dvěma řetězci lze zvýšit nahrazením speciálních znaků hodnotou null nebo mezerou. Interpunkční znaménka nebo jiné symboly se můžou snadno lišit v různých řetězcích. Interní nahrazení speciálních znaků může umožnit, aby skóre překročilo minimální odpovídající prahovou hodnotu v DQS, což způsobí, že dva řetězce budou považovány za shody, i když by jinak nebyly považovány. Jestli se ale rozhodnete ignorovat speciální znaky, může záviset na typu dat, se kterými pracujete. Když například pracujete s daty v anglickém systému měření, ignorování dvojitých uvozovek a jednoduchých uvozovek v datech produktu může vést k falešně pozitivním výsledkům, pokud dvojitá uvozovka představuje palce a jedna uvozovka představuje stopu.
Normalizace se provádí, když jsou data načtena a indexována ve fázích zpracování dat zjišťování, politiky párování, projektů párování a aktivit čištění projektu. Pokud je tato možnost povolená, normalizace a transformace relací založených na termínech se před analýzou provádějí ve fázi předběžného zpracování. Spouští se v každé doméně před tím, než se použijí algoritmy, které vypočítá podobnost mezi řetězci. Pokud je požadováno parsování složených domén, provede se před normalizací a transformací vztahů založených na termínech, protože analýza oddělovače vyžaduje symboly. Další operace, jako jsou pravidla domény a změny hodnot domény, budou provedeny po transformaci. Výsledná data se nezmění interním nahrazením speciálních znaků v DQS.
Nastavit formát výstupu na
Vyberte formátování, které se použije při výstupu datových hodnot v doméně. Formátování je specifické pro vybraný datový typ, jak je znázorněno v následujícím seznamu. Výběr Žádné znamená, že se nepoužije žádný z formátů v seznamu.
Pro řetězcovou hodnotu můžete zadat, že řetězec bude výstupem velkými písmeny, malými písmeny nebo kapitalizovaně.
Pro hodnotu data můžete zadat formát dne, měsíce a roku.
Pro celočíselnou hodnotu můžete zadat typ masky formátu, který se má použít.
Pro desetinnou hodnotu můžete zadat přesnost a typ masky formátu, který se má použít.
Jazyk
Pokud je datový typ řetězcový, vyberte jazyk, ke kterému chcete doménu přidružit pro fungování kontroly pravopisu. Tento výběr platí jenom pro kontrolu pravopisu, protože výsledky kontroly pravopisu závisí na používaném jazyce. Výběr se vztahuje pouze na jednu doménu s datovým typem je řetězec. Vlastnost jazyka není relevantní pro složené domény. Jazyk pro každou část složené domény je určen příslušnou jedinou doménou.
Angličtina je výchozím jazykem. Nastavení vlastnosti jazyka na Jiné zakáže kontrolu pravopisu pro doménu.
Spropitné
Pokud váš jazyk není uvedený v rozevíracím seznamu Jazyk , musíte vybrat Jiné. Tím zajistíte, že DQS vyčistí a eliminuje duplicity pro data jazyka, která nejsou uvedená v seznamu, na základě dostupných znalostí (pravidel domény, hodnot domény, tbr, odpovídajícího pravidla) v doméně.
Povolit kontrolu pravopisu
Pokud je datový typ String, kliknutím povolte kontrolu pravopisu DQS pro doménu. Speller funguje jenom na doménách s datovým typem řetězce. Zaškrtávací políčko Povolit kontrolu pravopisu povolí kontrolu pravopisu pouze pro jednu doménu přidruženou k zaškrtávacímu políčku. Zaškrtávací políčko se nevztahuje na složenou doménu.
Speller navrhuje opravy chyb v syntaxi a ověření hodnot v doméně. Další informace naleznete v tématu Použití nástroje DQS Speller.
Zakázání algoritmů chyb syntaxe
Pokud je datový typ Řetězec, vyberte, chcete-li určit, že DQS neidentifikuje syntaxe chyby v doméně během čištění. Toto políčko zaškrtněte, když je identifikace chyb syntaxe pro danou doménu irelevantní. Například identifikace chyb syntaxe nemusí být důležitá pro sériové číslo. Tento ovládací prvek je k dispozici pouze pro řetězcový datový typ. DQS nekontroluje chyby syntaxe datových typů, které nejsou řetězcové.