Vyčištění dat pomocí interních znalostí DQS
platí pro:SQL Server
Toto téma popisuje, jak vyčistit data pomocí projektu kvality dat ve službě Data Quality Services (DQS). Očišťování dat se provádí u vašich zdrojových dat pomocí znalostní báze, která byla vybudována v DQS na základě vysoce kvalitní sady dat. Další informace naleznete v tématu Sestavení znalostní báze.
Čištění dat se provádí ve čtyřech fázích: fáze mapování, v níž identifikujete zdroj dat, který se má vyčistit, a namapujete ho na požadované domény ve znalostní bázi, fáze počítačem asistovaného čištění, ve které DQS aplikuje znalostní bázi na data k vyčištění a navrhuje/provádí změny zdrojových dat, fáze interaktivního čištění, ve které mohou správci dat analyzovat změny v datech a přijmout/odmítnout je, a nakonec fáze exportu pro export vyčištěných dat. Každý z těchto procesů se provádí na samostatné stránce průvodce procesem čištění, který umožňuje přecházet mezi různými stránkami, spustit znovu proces, uzavřít konkrétní proces čištění a vrátit se do téže fáze. DQS poskytuje statistiky o zdrojových datech a výsledky čištění, které vám umožní činit informovaná rozhodnutí o čištění dat.
Než začnete
Požadavky
Pro aktivitu čištění musíte zadat odpovídající prahové hodnoty. Informace o tom najdete v tématu Konfigurace prahových hodnot pro čištění a porovnávání.
Znalostní báze DQS musí být k dispozici na serveru pro kvalitu dat, se kterým chcete porovnat, a vyčistit zdrojová data. Znalostní báze navíc musí obsahovat znalosti o typu dat, která chcete vyčistit. Pokud například chcete vyčistit zdrojová data, která obsahují adresy USA, musíte mít znalostní bázi, která byla vytvořena proti "vysoce kvalitním" ukázkovým datům pro adresy USA.
Pokud jsou zdrojová data vyčištěná v excelovém souboru, musí být na počítači klienta kvality dat nainstalována aplikace Microsoft Excel. Jinak nebudete moct vybrat excelové soubory ve fázi mapování. Soubory vytvořené aplikací Microsoft Excel mohou mít příponu .xlsx, .xlsnebo .csv. Pokud se používá 64bitová verze Aplikace Excel, jsou podporovány pouze soubory aplikace Excel 2003 (.xls). Soubory Excelu 2007 nebo 2010 (.xlsx) nejsou podporované. Pokud používáte 64bitovou verzi Excelu 2007 nebo 2010, uložte soubor jako soubor .xls nebo .csv nebo nainstalujte 32bitovou verzi Excelu.
Bezpečnost
Dovolení
K čištění dat musíte mít v databázi DQS_MAIN roli dqs_kb_editor nebo dqs_kb_operator.
Vytvoření projektu pro kvalitu čištění dat
K provedení operace čištění dat je nutné použít projekt kvality dat. Vytvoření projektu kvality čištění dat:
Postupujte podle kroků 1 až 3 v tématu Vytvoření projektu kvality dat.
V kroku 3.d vyberte aktivitu Čištění.
Kliknutím na Vytvořit vytvořte projekt na zlepšení kvality dat čištěním.
Tím se vytvoří projekt čištění kvality dat a otevře se stránka Mapa průvodce kvalitou dat při čištění.
Fáze mapování
Ve fázi mapování zadáte připojení ke zdrojovým datům, která se mají vyčistit, a namapujete sloupce ve zdrojových datech s příslušnými doménami ve vybrané znalostní bázi.
Na stránce Map průvodce čištěním kvality dat vyberte zdrojová data, která chcete vyčistit: SQL Server nebo soubor Excel.
SQL Server: Pokud jste zkopírovali zdrojová data do této databáze, vyberte DQS_STAGING_DATA jako zdrojová databáze a pak vyberte příslušnou tabulku nebo zobrazení, které obsahuje zdrojová data. V opačném případě vyberte zdrojovou databázi a příslušnou tabulku nebo zobrazení. Zdrojová databáze musí být k dispozici ve stejné instanci SYSTÉMU SQL Server jako Server kvality dat, aby byla dostupná v rozevíracím seznamu Database.
Soubor aplikace Excel: Klikněte na Procházeta vyberte soubor aplikace Excel, který obsahuje data, která chcete vyčistit. Aby bylo možné vybrat excelový soubor, musí být v počítači klienta kvality dat nainstalována aplikace Microsoft Excel. V opačném případě nebude tlačítko Procházet k dispozici a pod tímto textovým polem se zobrazí oznámení, že aplikace Microsoft Excel není nainstalovaná. Pokud první řádek excelového souboru obsahuje data záhlaví, nechejte zaškrtnuté políčko Použít první řádek jako záhlaví.
V části Mapovánípřiřaďte datové sloupce ve zdrojových datech k odpovídajícím doménám ve znalostní bázi výběrem zdrojového sloupce z rozevíracího seznamu ve sloupci Zdrojový sloupec a poté výběrem domény z rozevíracího seznamu ve sloupci Doména ve stejném řádku. Tento krok opakujte, pokud chcete namapovat všechny sloupce ve zdrojových datech s příslušnými doménami ve znalostní bázi. V případě potřeby můžete kliknutím na ikonu Přidat mapování sloupců přidat sloupce do tabulky mapování.
Poznámka
Zdrojová data můžete namapovat na doménu DQS pro čištění dat pouze v případě, že je zdrojový datový typ podporovaný v DQS a odpovídá datovému typu domény DQS. Informace o podporovaných zdrojových datových typech naleznete v tématu Podporované sql Server a datové typy SSIS pro domény DQS.
Kliknutím na ikonu Náhled zdroje dat zobrazíte data v tabulce nebo zobrazení SQL Serveru, které jste vybrali, nebo na excelovém listu, který jste vybrali.
Kliknutím na Zobrazit nebo vybrat složené domény zobrazíte seznam složených domén mapovaných na zdrojový sloupec. Toto tlačítko je k dispozici pouze v případě, že máte alespoň jednu složenou doménu namapovanou na zdrojový sloupec.
Kliknutím na tlačítko Další přejděte do fáze počítačem asistovaného čištění (Vyčištění stránky).
Computer-Assisted fáze čištění
Ve fázi čištění s asistencí počítače spustíte automatizovaný proces čištění dat, který analyzuje zdrojová data proti mapovaným doménám ve znalostní bázi a provádí/navrhuje změny dat.
Na stránce průvodce kvalitou dat Čištění klikněte na Spustit pro zahájení procesu čištění pomocí počítače. DQS používá pokročilé algoritmy a úrovně spolehlivosti založené na zadaných prahových hodnotách k analýze vašich dat vůči vybrané znalostní bázi a následnému vyčištění. Podrobné informace o tom, jak probíhá čištění pomocí počítače v DQS, naleznete v tématu Čištění pomocí počítače v čištění dat.
Důležitý
Po dokončení analýzy dat se tlačítko Start změní na tlačítko Restartovat. Pokud se výsledky z předchozí analýzy ještě neuložily, kliknutí na Restart způsobí ztrátu předchozích dat. Při spuštění analýzy neopusťte stránku nebo proces analýzy se ukončí.
Pokud se znalostní báze používaná pro čisticí projekt aktualizovala a publikovala po vytvoření projektu čištění, klikněte na Spustit zobrazí výzvu, zda chcete k čištění použít nejnovější znalostní bázi. K tomu obvykle může dojít v případě, že jste vytvořili projekt kvality dat pomocí znalostní báze, zavřete projekt čištění uprostřed kliknutím na Zavříta pak znovu otevřete projekt kvality dat později, aby bylo možné provést čištění. Mezitím byla znalostní báze použitá v projektu čištění aktualizována a publikována.
Pokud byla znalostní báze používaná pro čisticí projekt aktualizována a publikována po posledním spuštění čištění s asistencí počítače, kliknutím na Restartovat budete vyzváni, zda chcete k čištění použít nejnovější znalostní bázi.
V obou případech klikněte na Ano pro použití aktualizované znalostní báze k čištění s počítačovou asistencí. Navíc pokud dojde ke konfliktům mezi aktuálním mapováním a aktualizovanou znalostní bázi (například domény byly odstraněny nebo došlo ke změně datového typu domény), zobrazí se ve zprávě také výzva k opravě aktuálních mapování pro použití aktualizované znalostní báze. Kliknutím na Ano přejdete na stránku Mapa, kde můžete mapování opravit, než budete pokračovat v čištění s asistencí počítače.
Během fáze čištění s asistencí počítače můžete profiler zapnout kliknutím na kartu Profiler a zobrazit profilaci dat a oznámení v reálném čase. Další informace viz Profiler Statistics.
Pokud s výsledky nejste spokojení, klikněte na Zpět, vraťte se na stránku Mapy, podle potřeby upravte jedno nebo více mapování, vraťte se na stránku Vyčištění a potom klikněte na Restartovat.
Po dokončení procesu čištění s asistencí počítače klikněte na Další pro přechod do interaktivní fáze čištění (na stránceSpravovat a zobrazit výsledky).
Interaktivní fáze čištění
V interaktivní fázi čištění můžete vidět změny, které DQS navrhl, a rozhodnout, jestli je implementovat, nebo ne schválením nebo odmítnutím změn. V levém podokně stránky Spravovat a zobrazit výsledky zobrazí DQS seznam všech domén, které jste namapovali dříve v fázi mapování, spolu s počtem hodnot ve zdrojových datech analyzovaných proti každé doméně během fáze čištění s asistencí počítače. V pravém panelu stránky Spravovat a zobrazit výsledky, na základě dodržování pravidel domény, pravidel chyb syntaxe a pokročilých algoritmů, DQS kategorizuje data do pěti karet pomocí úrovně spolehlivosti. Úroveň spolehlivosti označuje rozsah jistoty DQS pro opravu nebo návrh a je založen na následujících prahových hodnotách:
prahová hodnota automatické opravy: DQS automaticky opraví libovolnou hodnotu, která má úroveň spolehlivosti nad touto prahovou hodnotou. Správce dat ale může změnu během interaktivního čištění přepsat. Prahovou hodnotu automatické opravy můžete zadat v kartě Obecná nastavení na obrazovce Konfigurace. Další informace najdete v tématu Konfigurace prahových hodnot pro čištění a porovnávání.
prahová hodnota automatického doporučení: Jakákoli hodnota, která má úroveň jistoty nad touto prahovou hodnotou, ale pod prahovou hodnotou automatické opravy, je navržena jako náhradní hodnota. DQS provede změnu jenom v případě, že ji správce dat schválí. Prahovou hodnotu automatického návrhu můžete zadat na kartě Obecné nastavení na obrazovce Konfigurace. Další informace najdete v tématu Konfigurace prahových hodnot pro čištění a porovnávání.
Jiné: Libovolná hodnota pod prahovou hodnotou automatického návrhu zůstává beze změny DQS.
Na základě úrovně spolehlivosti se hodnoty zobrazí na následujících pěti kartách:
Tabulátor | Popis |
---|---|
navrhované | Zobrazí hodnoty domény, pro které DQS našla navrhované hodnoty s úrovní spolehlivosti vyšší než práh automatického návrhu , ale nižší než práh automatické opravy . Navrhované hodnoty se zobrazí ve sloupci Správné ve srovnání s původní hodnotou. Kliknutím na přepínač ve sloupci Schválit nebo Odmítnout vedle hodnoty v horní mřížce můžete návrh pro všechny výskyty této hodnoty přijmout nebo odmítnout. V tomto případě se akceptovaná hodnota přesune na kartu Oprava a odmítnutá hodnota se přesune na kartu Neplatný. |
Nový | Zobrazí platnou doménu, pro kterou DQS nemá dostatek informací, a proto ji nelze mapovat na žádnou jinou kartu. Tato karta obsahuje také hodnoty, které mají nižší úroveň spolehlivosti než prahová hodnota automatického návrhu hodnotu, ale dostatečně vysoká, aby byla označena jako platná. Pokud si myslíte, že je hodnota správná, zaškrtněte přepínač ve sloupci Schválit. Jinak klikněte na přepínač ve sloupci Odmítnout. Akceptovaná hodnota se přesune na kartu Správná a odmítnutá hodnota se přesune na kartu Neplatná. Můžete také ručně zadat správnou hodnotu jako náhradu za původní hodnotu ve sloupci Opravit na vedle hodnoty a poté kliknutím na radiobutton ve sloupci Schválit přijmout změnu. V tomto případě se hodnota přesune na kartu Opraveno. |
Neplatný | Zobrazí hodnoty domény, které byly v doméně ve znalostní bázi označeny jako neplatné, nebo hodnoty, které selhaly pravidlem domény. Tato karta rovněž obsahuje hodnoty, které byly uživatelem odmítnuty v kterékoli z dalších čtyř karet. Jestliže si myslíte, že je hodnota správná, zaškrtněte přepínač ve sloupci Schválit. Přijatá hodnota se přesune na kartu Správná. Můžete také ručně zadat správnou hodnotu jako náhradu za původní hodnotu ve sloupci Opravit na naproti hodnotě a potom kliknutím na rádiové tlačítko ve sloupci Schválit pro potvrzení změny. V tomto případě se hodnota přesune na kartu Opraveno. |
Opravené | Zobrazí hodnoty domény, které jsou opraveny DQS během automatizovaného procesu čištění, protože DQS našla opravu hodnoty s úrovní spolehlivosti nad prahovou hodnotou automatické opravy. Opravené hodnoty se zobrazí ve sloupci 'Opraveno na' vedle původní hodnoty. Ve výchozím nastavení je ve sloupci Schválit vybrán přepínač odpovídající hodnotě. V případě potřeby můžete navrhované opravy odmítnout tak, že kliknete na přepínač ve sloupci Odmítnout a přesunete ho na kartu Neplatný, nebo ručně zadáte správnou hodnotu do sloupce Správná hodnota a potom kliknutím na přepínač ve sloupci Schválit změnu přijmete a přesunete ji na kartu Opraveno. |
správné | Zobrazí hodnoty domény, které byly nalezeny správně. Například hodnota odpovídala hodnotě domény. Tato karta obsahuje také hodnoty schválené uživatelem kliknutím na radiové tlačítko ve sloupci Schválit na kartách Nový a Neplatné. Ve výchozím nastavení je rádiové tlačítko ve sloupci Schválit vybráno u každé hodnoty. Pokud se však domníváte, že hodnota na této kartě není správná, můžete buď kliknout na radio tlačítko ve sloupci Odmítnout vedle hodnoty a přesunout ji na kartu Neplatný, nebo ručně zadat správnou hodnotu jako náhradu za hodnotu ve sloupci Opravit Na, a potom kliknout na radio tlačítko ve sloupci Schválit, abyste změnu přijali a přesunuli ji na kartu Opraveno. |
Interaktivní čištění dat:
Na stránce Spravovat a zobrazit výsledky průvodce čištěním kvality dat klikněte v levém podokně na název domény.
Zkontrolujte hodnoty domén na pěti kartách a proveďte odpovídající akci, jak bylo dříve vysvětleno.
V pravém horním podokně se zobrazí následující informace pro každou hodnotu ve vybrané doméně: původní hodnota, počet instancí (záznamů), pole pro zadání další (správné) hodnoty, úroveň spolehlivosti (není k dispozici pro hodnoty na kartě Správná), důvod akce DQS s hodnotou a možnost schválit a odmítnout opravy a návrhy hodnoty.
Rada
V pravém horním podokně můžete kliknutím na ikonu Schválit všechny pojmy nebo ikonu Odmítnout všechny pojmy schválit nebo odmítnout všechny hodnoty ve vybrané doméně. Případně můžete pravým tlačítkem myši kliknout na hodnotu v zvolené doméně a v místní nabídce kliknout na Přijmout všechny nebo Odmítnout všechny.
V dolním podokně se zobrazí jednotlivé výskyty hodnoty domény vybrané v pravém horním podokně. Zobrazí se následující informace: pole určující jinou (správnou) hodnotu, úroveň spolehlivosti (není k dispozici pro hodnoty na kartě Správná), důvod akce DQS s hodnotou, možnost schválit a odmítnout opravy a návrhy hodnoty a původní hodnotu.
Pokud jste při vytváření domény povolili funkci Speller, zobrazí se červené vlnovky u hodnot domény, které jsou identifikovány jako potenciální chyba. Podtržítko se zobrazí pro celou hodnotu. Pokud je například "New York" nesprávně napsaný jako "Neu York", zobrazí se červené podtržítko pod "Neu York" a nikoli jen pod "Neu". Pokud kliknete pravým tlačítkem myši na hodnotu, zobrazí se navrhované opravy. Pokud existuje více než 5 návrhů, můžete kliknout na Další návrhy v místní nabídce a zobrazit zbývající návrhy. Stejně jako u zobrazení chyby jsou návrhy náhradou za celou hodnotu. Například "New York" se zobrazí jako návrh v předchozím příkladu, a ne jako "Nový". Můžete vybrat některý z návrhů nebo přidat hodnotu do slovníku, který se má pro danou hodnotu zobrazit. Hodnoty se ukládají ve slovníku na úrovni uživatelského účtu. Když vyberete návrh z místní nabídky pro kontrolu pravopisu, vybraný návrh se přidá do sloupce Opravit na. Pokud však vyberete návrh ve sloupci Opravit pro, nahradí se hodnota ve sloupci vybraným návrhem.
Funkce kontroly pravopisu je ve výchozím nastavení povolená v interaktivní fázi čištění. V interaktivní fázi čištění můžete zakázat kontrolu pravopisu kliknutím na ikonu Povolit/Zakázat Kontrolu Pravopisu nebo pravým tlačítkem myši v oblasti hodnot domény, a poté kliknutím na Kontrola pravopisu v místní nabídce. Pokud ho chcete znovu povolit, udělejte to samé.
Poznámka
Funkce kontroly pravopisu je dostupná pouze v horním podokně (hodnoty domény). Kromě toho nemůžete povolit ani zakázat kontrolu pravopisu pro složené domény. Podřízené domény ve složené doméně, které jsou typu řetězce a mají povolenou funkci kontrolu pravopisu, budou mít ve výchozím nastavení tuto funkcionalitu povolenou během interaktivní fáze čištění.
Během interaktivní fáze čištění můžete profiler zapnout kliknutím na kartu Profiler a zobrazit profilaci dat a oznámení v reálném čase. Další informace naleznete v tématu Profiler Statistics.
Až zkontrolujete všechny hodnoty domény, klikněte na Další a přejděte do fáze exportu.
Fáze exportu
Ve fázi exportu zadáte parametry pro export vyčištěných dat: co a kde exportovat.
Na stránce Export průvodce pro kvalitu čištění dat vyberte cílový typ pro export vyčištěných dat: SQL Server, souboru CSVnebo Excelového souboru.
Důležitý
Pokud používáte 64bitovou verzi aplikace Excel, nemůžete data vyčištěná do excelového souboru exportovat; můžete exportovat pouze do databáze SQL Serveru nebo do .csv souboru.
SQL Serveru: Pokud chcete exportovat data, vyberte DQS_STAGING_DATA jako cílovou databázi a zadejte název tabulky, který se vytvoří pro uložení exportovaných dat. V opačném případě vyberte jinou databázi, pokud chcete exportovat data do jiné databáze, a pak zadejte název tabulky, který se vytvoří pro uložení exportovaných dat. Vaše cílová databáze musí být k dispozici ve stejné instanci SQL Serveru jako Server kvality dat, aby byla dostupná v rozevíracím seznamu Database.
soubor CSV: Klikněte na Procházeta zadejte název a umístění souboru .csv, kam chcete vyexportovat vyčištěná data. Můžete také zadat název souboru .csv spolu s úplnou cestou, kam chcete exportovat vyčištěná data. Například "c:\ExportedData.csv". Soubor se uloží do počítače, na kterém je nainstalovaný Server pro kvalitu dat.
Excelového souboru: Klikněte na Procházeta zadejte název a umístění Excelového souboru, kam chcete vyexportovat vyčištěná data. Můžete také zadat název souboru excelového souboru spolu s úplnou cestou, kam chcete vyexportovat vyčištěná data. Například "c:\ExportedData.xlsx". Soubor se uloží do počítače, na kterém je nainstalovaný Server pro kvalitu dat.
Zaškrtněte políčko Standardizovat výstup pro standardizaci výstupu na základě formátu výstupu vybraného pro doménu. Například změňte hodnotu řetězce na velká písmena nebo kapitalizujte první písmeno slova. Informace o určení výstupního formátu domény naleznete v seznamu Formát výstupu pro v Nastavení vlastností domény.
Dále vyberte výstup dat: exportujte pouze vyčištěná data nebo exportujte vyčištěná data spolu s informacemi o čištění.
Data Only: Kliknutím na přepínač exportujte pouze vyčištěná data.
Data a informace o čištění: Kliknutím na radio tlačítko exportujte následující data pro každou doménu:
<Doména>_Source: Původní hodnota v doméně.
<Doména>_Output: Vyčištěné hodnoty v doméně.
<Doména>_Reason: Důvod určený pro opravu hodnoty.
<Doména>_Confidence: Úroveň spolehlivosti pro všechny termíny, které byly upravovány. Zobrazí se jako desetinná hodnota odpovídající odpovídající procentuální hodnotě. Například úroveň spolehlivosti 95% se zobrazí jako 0,9500000.
<Doména>_Status: Stav hodnoty domény po čištění dat. Například navrhované, nové, neplatné, opravenonebo správné.
Stav záznamu: Kromě pole stavu pro každou mapovanou doménu (<DomainName>_Status) zobrazuje pole Stav záznamu stav záznamu. Pokud je některý ze stavů domény v záznamu Nová nebo Správná, je stav záznamu nastaven na Správné. Pokud má některý ze stavů domény v záznamu hodnotu Navrhované, Neplatnénebo Opraveno, pak je Stav záznamu nastaven na odpovídající hodnotu. Pokud je například některý ze stavů domény v záznamu Navrhované, nastaví se Stav záznamu na Navrhované.
Poznámka
Pokud pro operaci čištění použijete referenční datovou službu, jsou pro export k dispozici také další data o hodnotě domény. Další informace najdete v části Vyčištění dat pomocí referenčních dat (externích znalostí).
Kliknutím na Exportovat exportujte data do vybraného cíle dat. Pokud jste vybrali:
SQL Server jako cíl dat, vytvoří se ve vybrané databázi nová tabulka se zadaným názvem.
soubor CSV slouží jako cíl pro data, soubor .csv bude vytvořen v umístění na počítači serveru kvality dat s názvem souboru, který jste zadali dříve v poli název souboru CSV.
Excelový soubor jako cíl dat, vytvoří se Excelový soubor v umístění na počítači serveru kvality dat s názvem souboru, který jste zadali dříve v poli název Excelového souboru.
Kliknutím na Dokončit zavřete projekt kontroly kvality dat.
Statistika profileru
Karta Profiler poskytuje statistiky, které označují kvalitu zdrojových dat. Profilace pomáhá vyhodnotit efektivitu aktivity čištění dat a můžete potenciálně určit rozsah, ve kterém bylo čištění dat schopno zlepšit kvalitu dat.
Karta Profiler poskytuje následující statistiky pro zdrojová data podle pole a domény:
záznamy: Kolik záznamů v datovém vzorku bylo analyzováno pro úkol čištění dat
správné záznamy: Kolik záznamů bylo nalezeno správně
opravených záznamů: Kolik záznamů bylo opraveno
navrhované záznamy: Kolik záznamů bylo navrženo
neplatných záznamů: Kolik záznamů bylo neplatné
Statistiky polí zahrnují následující:
Pole: Název pole ve zdrojových datech
Doména: Název domény, která se mapuje na pole
opravené hodnoty: Počet hodnot domény, které byly opraveny
navrhované hodnoty: Počet navrhovaných hodnot domény
Úplnost: Úplnost každého zdrojového pole, které je určeno pro vyčištění aktivity
přesnost: Přesnost každého zdrojového pole, které je přiřazené k aktivitě čištění
Profilace DQS poskytuje dvě dimenze kvality dat: úplnost (rozsahu, v jakém jsou data přítomna) a přesnost (rozsah, do kterého lze data použít pro zamýšlené použití). Pokud profilace říká, že pole je relativně neúplné, můžete ho odebrat ze znalostní báze projektu kvality dat. Profilace nemusí poskytovat spolehlivou statistiku úplnosti pro složené domény. Pokud potřebujete statistiku úplnosti, použijte místo složených domén jednotlivé domény. Pokud chcete použít složené domény, můžete vytvořit jednu znalostní bázi s jednou doménou pro profilaci, určit úplnost a vytvořit další doménu se složenou doménou pro proces čištění. Například profilace může zobrazit 95% úplnost záznamů adres pomocí složené domény, ale pro jeden ze sloupců může být mnohem vyšší úroveň neúplnosti, například sloupec PSČ. V tomto příkladu můžete chtít změřit úplnost sloupce PSČ s jednou doménou. Profilace bude pravděpodobně poskytovat spolehlivé statistiky přesnosti pro složené domény, protože můžete měřit přesnost více sloupců společně. Hodnota těchto dat je ve složené agregaci, takže můžete chtít změřit přesnost složenou doménou.
Statistiky přesnosti budou pravděpodobně vyžadovat více interpretace, pokud nepoužíváte referenční datovou službu. Pokud k čištění dat používáte referenční datovou službu, budete mít úroveň důvěryhodnosti ve statistikách přesnosti. Další informace o čištění dat pomocí referenční datové služby naleznete v tématu Čištění dat pomocí referenčních dat (externí) znalostní.
Oznámení o čištění
Následující podmínky vedou k oznámením:
Pole neobsahuje žádné opravy ani návrhy. Možná ho budete chtít odebrat z mapování, nejprve spustit zjišťování znalostí nebo použít jinou znalostní bázi.
Pole obsahuje poměrně málo oprav nebo návrhů. Možná ho budete chtít odebrat z mapování, nejprve spustit zjišťování znalostí nebo použít jinou znalostní bázi.
Úroveň přesnosti pole je velmi nízká. Možná budete chtít ověřit mapování nebo nejprve zvážit spuštění zjišťování znalostí.
Další informace o profilaci naleznete v tématu Profilace dat a oznámení v DQS.