Domeineigenschappen instellen
van toepassing op:SQL Server-
In dit onderwerp wordt beschreven hoe u domeineigenschappen instelt in DQS (Data Quality Services).
Voordat u begint
Voorwaarden
Als u eigenschappen voor een domein wilt instellen, moet u een Knowledge Base en een domein hebben gemaakt.
Veiligheid
Machtigingen
U moet de dqs_kb_editor of de rol van de dqs_administrator in de DQS_MAIN-database hebben om eigenschappen voor een domein in te stellen.
Domeineigenschappen instellen
Stel eigenschappen in voor een bestaand domein door een knowledge base te openen in de activiteit Domeinbeheer (zie Een Knowledge Base openen) en selecteer vervolgens het juiste domein in de lijst Domein. De pagina Domeineigenschappen wordt standaard weergegeven.
Stel eigenschappen in voor een nieuw domein nadat u het hebt gemaakt, zoals beschreven in Een domein maken.
Klik op voltooien om de domeinbeheeractiviteit te voltooien, zoals beschreven in De activiteit domeinbeheer beëindigen.
Opvolgen: Na het instellen van domeineigenschappen
Nadat u domeineigenschappen hebt ingesteld, kunt u andere domeinbeheertaken op het domein uitvoeren, kunt u kennisdetectie uitvoeren om kennis aan het domein toe te voegen, of u kunt een overeenkomend beleid toevoegen aan het domein. Zie Knowledge Discovery-uitvoeren, Een domeinbeheren of Een overeenkomend beleid makenvoor meer informatie.
Domeineigenschappen
Domeinnaam en beschrijving
Zodra een domein is gemaakt, kan de domeinnaam of beschrijving worden gewijzigd. De domeinnaam moet uniek zijn voor de Knowledge Base. De beschrijving mag maximaal 256 tekens bevatten.
Gegevenstype
Wanneer u het domein maakt, selecteert u een van de volgende gegevenstypen voor de waarden in het domein: tekenreeks (de standaardinstelling), datum, geheel getalof decimaal. Nadat u het domein hebt gemaakt, kunt u het gegevenstype weergeven, maar u kunt het niet wijzigen. Het geselecteerde gegevenstype voor een domein definieert het type brongegevens dat kan worden toegewezen aan het domein. Zie voor informatie over ondersteunde gegevenstypen voor elk van de vier domeingegevenstypen in DQS Ondersteunde SQL Server- en SSIS-gegevenstypen voor DQS-domeinen.
Toonaangevende waarden gebruiken
Schakel dit selectievakje in om op te geven dat de leidende waarde in een groep synoniemen wordt uitgevoerd in plaats van een synonieme waarde. Deselecteer Gebruik Voorloopwaarden om aan te geven dat elke synoniemwaarde in zijn correcte of gecorrigeerde vorm wordt weergegeven en niet wordt vervangen door de voorloopwaarde van de groep.
Tekenreeks normaliseren
Als het gegevenstype stringis, klik om de speciale tekens in de brongegevens te negeren voor de gegevenskwaliteitsverwerking met DQS. DQS vervangt intern de speciale tekens door een null- of spatie wanneer de gegevens in het domein worden geladen. Een dubbele punt, afbreekstreepje, punt, dubbele aanhalingsteken of puntkomma wordt vervangen door een spatie. Eén aanhalingsteken wordt vervangen door een null. Met behulp van null worden de twee delen van de string samengebracht.
Als u speciale tekens in een tekenreekswaarde negeert, kan de nauwkeurigheid van overeenkomende tekens toenemen. De overeenkomstscore tussen twee tekenreeksen kan worden verhoogd door speciale tekens te vervangen door een lege waarde of spatie. Interpunctiemarkeringen of andere symbolen kunnen eenvoudig verschillen in verschillende tekenreeksen. Als u speciale tekens intern vervangt, kan de score de minimumdrempel voor overeenkomende tekens in DQS overschrijden, waardoor twee tekenreeksen worden beschouwd als overeenkomsten wanneer ze anders niet zo zouden zijn geweest. Of u er echter voor kiest om speciale tekens te negeren, is afhankelijk van het type gegevens waarop u overeenkomsten uitvoert. Als u bijvoorbeeld met gegevens in het Engelse Meetsysteem werkt, kan het negeren van dubbele en enkele aanhalingstekens in productgegevens leiden tot vals-positieven als dubbele aanhalingstekens een inch aangeven en enkele aanhalingstekens een voet aangeven.
Normalisatie wordt uitgevoerd wanneer gegevens worden geladen en geïndexeerd in de gegevensverwerkingsfasen van detectie, overeenkomend beleid, overeenkomend project en opschoningsprojectactiviteiten. Indien ingeschakeld, worden normalisatie en op termen gebaseerde relatietransformatie beide uitgevoerd in een voorverwerkingsfase vóór analyse. Ze worden uitgevoerd op elk domein voordat algoritmen worden toegepast die overeenkomsten tussen tekenreeksen berekenen. Als parseren van samengestelde domeinen wordt aangevraagd, wordt deze uitgevoerd vóór normalisatie en op termen gebaseerde relatiestransformatie, omdat parseren van scheidingstekens symbolen vereist. Andere bewerkingen, zoals domeinregels en domeinwaardewijzigingen, worden uitgevoerd na de transformaties. De resulterende gegevens worden niet gewijzigd door de interne vervanging van speciale tekens in DQS.
Uitvoer opmaken naar
Selecteer de opmaak die wordt toegepast wanneer de gegevens in het domein worden weergegeven. De opmaak is specifiek voor het geselecteerde gegevenstype, zoals wordt weergegeven in de volgende lijst. Als u Geen selecteert, wordt geen van de notaties in de lijst toegepast.
Voor een tekenreekswaarde kunt u specificeren dat de tekenreeks moet worden uitgevoerd in hoofdletters, kleine letters of als gekapitaliseerd.
Voor een datumwaarde kunt u het formaat van de dag, maand en jaar opgeven.
Voor een geheel getal kunt u het type opmaakmasker opgeven dat moet worden toegepast.
Voor een decimale waarde kunt u de nauwkeurigheid en het type opmaakmasker opgeven dat moet worden toegepast.
Taal
Als het gegevenstype Stringis, selecteert u met welke taal u het domein wilt associëren voor de werking van de spellingcontrole. Deze selectie is alleen van toepassing op de spellingcontrole, omdat de resultaten van de spellingcontrole afhankelijk zijn van de taal die wordt gebruikt. De selectie is alleen van toepassing op één domein met een gegevenstype dat string is. De taaleigenschap is niet relevant voor samengestelde domeinen. De taal voor elk deel van een samengesteld domein wordt bepaald door het relevante domein.
Engels is de standaardtaal. Als de eigenschap Taal wordt ingesteld op Overig, wordt de spellingcontrole voor het domein uitgeschakeld.
Fooi
Als uw taal niet wordt vermeld in de vervolgkeuzelijst Taal, moet u Andereselecteren. Dit zorgt ervoor dat DQS duplicaten opschoont en elimineert voor de niet-vermelde taalgegevens op basis van de beschikbare kennis (domeinregels, domeinwaarden, TBR's, overeenkomende regel) in het domein.
Spellingcontrole inschakelen
Als het gegevenstype is tekenreeks, klikt u om de DQS-spellingfunctie voor het domein in te schakelen. De Speller functioneert slechts op domeinen met een gegevenstype tekenreeks. Met het selectievakje Spellingcontrole inschakelen schakelt u de spellingcontrole alleen in voor het ene domein dat aan het selectievakje is gekoppeld. Het selectievakje is niet van toepassing op een samengesteld domein.
De Spellinger stelt syntaxis- en validatiecorrecties voor op waarden in het domein. Voor meer informatie, zie Gebruik de DQS-spellingcontrole.
Syntaxisfoutalgoritmen uitschakelen
Als het gegevenstype tekenreeksis, kies om aan te geven dat syntaxisfouten niet worden geïdentificeerd door DQS in het domein tijdens het opschonen. Selecteer dit selectievakje wanneer het niet relevant is om syntaxisfouten voor dat domein te identificeren. Het identificeren van syntaxisfouten is bijvoorbeeld niet van belang voor een serienummer. Dit besturingselement is alleen beschikbaar voor het gegevenstype tekenreeks. DQS controleert niet-tekenreeksgegevenstypen niet op syntaxisfouten.