Delen via


Een samengesteld domein maken

van toepassing op:SQL Server-

In dit onderwerp wordt beschreven hoe u een samengesteld domein maakt in een Knowledge Base in DQS (Data Quality Services). Een samengesteld domein bestaat uit een of meer enkele domeinen die van toepassing zijn op één gegevensveld. Zie Een samengesteld domein beherenvoor meer informatie over samengestelde domeinen.

Er zijn twee manieren om een nieuw samengesteld domein te maken. De eerste is tijdens de Map-stap van de kennisontdekkingsactiviteit, wanneer u bezig bent met het analyseren van een datarepresentatie om kennis toe te voegen aan een nieuwe of bestaande kennisbasis. De tweede is tijdens de domeinbeheeractiviteit, wanneer u in plaats van een bestaand domein te wijzigen, een nieuw domein maakt. Als u een samengesteld domein wilt maken, moet u al ten minste twee afzonderlijke domeinen hebben gemaakt om toe te voegen aan het samengestelde domein. Alleen de enkele domeinen die al zijn gemaakt en die niet aan een bestaand samengesteld domein zijn toegevoegd, zijn beschikbaar wanneer u een nieuw samengesteld domein maakt. Eén domein kan niet worden toegevoegd aan meer dan één samengesteld domein en een samengesteld domein kan niet worden toegevoegd aan een ander samengesteld domein.

Nadat u een samengesteld domein hebt gemaakt, kunt u de eigenschappen van het samengestelde domein wijzigen, een referentiegegevensservice koppelen aan het domein, regels voor meerdere domeinen maken of waarderelaties maken. Hiervoor selecteert u het samengestelde domein in de lijst Domein van de pagina Domain Management en selecteert u het betreffende tabblad.

Voordat u begint

Voorwaarden

Als u een samengesteld domein wilt maken, moet u een knowledge base hebben gemaakt en geopend en moet u ten minste twee afzonderlijke domeinen hebben gemaakt om toe te voegen aan het samengestelde domein.

Veiligheid

Machtigingen

U moet de dqs_kb_editor of de rol dqs_administrator hebben op de DQS_MAIN-database om een samengesteld domein te maken.

Een samengesteld domein maken in de kennisdetectieactiviteit

  1. Start de client voor gegevenskwaliteit. Voor meer informatie hierover, zie De clienttoepassing voor gegevenskwaliteit uitvoeren.

  2. Klik in het startscherm van de client voor gegevenskwaliteit op Knowledge Base openen en selecteer vervolgens een knowledge base of klik op Nieuwe knowledge base en voer eigenschappen in voor de nieuwe knowledge base.

  3. Selecteer Knowledge Discovery- als activiteit en klik vervolgens op maken om de nieuwe knowledge base te maken of Open om een bestaande knowledge base te openen.

  4. Geef op de pagina Kaart- een verbinding met de gegevensbron op. Raadpleeg Kennisontdekking uitvoerenvoor meer informatie.

  5. Selecteer in de tabel Toewijzingen een bronkolom uit de vervolgkeuzelijst voor de kolom Bronkolom van een lege rij. Zorg ervoor dat de bronkolom samengesteld domein bevat dat is geadresseerd door twee bestaande enkelvoudige domeinen. Als er geen overeenkomende domeinen bestaan, klikt u op het pictogram Een domein maken.

  6. Selecteer in de tabel Toewijzingen een bronkolom uit de vervolgkeuzelijst voor de kolom Bronkolom van een lege rij. Zorg ervoor dat de bronkolom samengestelde domeindelen bevat die worden behandeld door twee bestaande enkelvoudige domeinen. Als er geen overeenkomende domeinen bestaan, klikt u op het pictogram Een domein maken om deze te maken. Zie Een domein makenvoor meer informatie.

  7. Klik op het pictogram Een samengesteld domein maken.

Een samengesteld domein maken in de domeinbeheeractiviteit

  1. Klik op de startpagina van de Data Quality Services-client op Knowledge Base openen en selecteer vervolgens een knowledge base of klik op Nieuwe knowledge base en voer eigenschappen in voor de nieuwe knowledge base.

  2. Selecteer Domain Management als activiteit en klik vervolgens op maken om de nieuwe Knowledge Base te maken of Open om een bestaande knowledge base te openen.

  3. Zorg ervoor dat er twee of meer enkele domeinen bestaan die vereist zijn voor het samengestelde domein. Als dat niet het geval is, klikt u op het pictogram Een domein maken en maakt u deze aan. Zie Een domein makenvoor meer informatie.

  4. Klik op de pagina Domain Management op het pictogram Een samengesteld domein maken boven de lijst met domeinen.

  5. Voer een naam in die uniek is voor de Knowledge Base en een beschrijving van maximaal 256 tekens.

  6. Selecteer in de lijst met domeinende domeinen die deel uitmaken van het samengestelde domein en klik op de pijl-rechts om ze te verplaatsen naar de Domeinen in samengesteld domein tabel.

  7. Klik op OK-.

Eigenschappen van samengesteld domein instellen

  1. Voer in het dialoogvenster Samengesteld domein maken een naam in die uniek is voor de kennisbank en een beschrijving van maximaal 256 tekens.

  2. Selecteer in de lijst met domeinende domeinen die deel uitmaken van het samengestelde domein en klik op de pijl-rechts om ze te verplaatsen naar de Domeinen in samengesteld domein tabel. Dit is een lijst met één domeinen die kunnen worden toegevoegd aan het samengestelde domein dat u maakt. Alleen de domeinen die al zijn gemaakt en die niet zijn toegevoegd aan een bestaand samengesteld domein, zijn beschikbaar. Eén domein kan niet worden toegevoegd aan meer dan één samengesteld domein in de Knowledge Base en een samengesteld domein kan niet worden toegevoegd aan een ander samengesteld domein.

  3. Klik op Geavanceerde.

  4. Selecteer een van de volgende opties voor de parseringsmethode:

    • Reference Data: Parseert de waarden van het veld op basis van de indeling van de gegevens door de Reference Data Service (RDS). Data Quality Services verzendt de waarden in het samengestelde domein naar de RDS en de RDS retourneert de gegevens die zijn gecorrigeerd en geparseerd volgens het domein in het samengestelde domein.

    • In volgorde: de waarden van het veld parseren op basis van de volgorde van domeinen in het samengestelde domein. De eerste waarde wordt opgenomen in het eerste domein, de tweede waarde in de tweede domeinen, enzovoort.

    • Scheidingstekens: Parse de waarden van het veld op basis van het scheidingsteken dat is geselecteerd in de keuzerondjes die worden weergegeven wanneer de Scheidingstekens zijn geselecteerd. Kan zijn Tab -, puntkomma -, komma -, spatie -, of andere -. Als Anders, voer de waarde in die als scheidingsteken fungeert.

  5. Als u scheidingstekens hebt geselecteerd voor de parseringsmethode, kunt u ook Knowledge Based Parsing gebruikenselecteren. Zie Knowledge-Based Parserenvoor meer informatie.

  6. Klik op voltooien om de domeinbeheeractiviteit te voltooien, zoals beschreven in De activiteit domeinbeheer beëindigen.

Opvolgen: Na het maken van een samengesteld domein

Nadat u een samengesteld domein hebt gemaakt, kunt u andere domeinbeheertaken uitvoeren op het domein, kunt u kennisdetectie uitvoeren om kennis aan het domein toe te voegen, of u kunt een overeenkomend beleid toevoegen aan het domein. Zie Knowledge Discovery-uitvoeren, Een domeinbeheren of Een overeenkomend beleid makenvoor meer informatie.

Knowledge-Based parseren

Met Data Quality Services kunt u gegevens parseren op basis van kennis, niet alleen op scheidingsteken of volgorde. Parseren op basis van kennis wordt gebruikt wanneer complexe brongegevens worden toegewezen aan een samengesteld domein en u geen referentiegegevensservices gebruikt. U kunt op kennis gebaseerde parsering gebruiken om de gegevens uit de gegevensbron te parseren in de relevante afzonderlijke domeinen. Met op kennis gebaseerde parsering probeert DQS eerst kennis te gebruiken om complexe gegevens in één domeinen te parseren. Indien mogelijk worden delen van de tekenreeks geïdentificeerd in een of meer domeinen, en wordt de tekenreeks geanalyseerd in zijn verschillende domeinen. Stel dat u 'John B. Doe' hebt als een complexe waarde in een veld met volledige naam dat wordt vertegenwoordigd door een samengesteld domein voor volledige naam. Als DQS 'John' identificeert zoals in het voornaamdomein en Doe, zoals in het achternaamdomein, voegt DQS 'B' toe aan het domein Middle Name op basis van domeinkennis.

U kunt op kennis gebaseerde parsering alleen gebruiken als u ook parseren op basis van scheidingstekens selecteert. Parseren op basis van kennis vervangt het parseren van scheidingstekens niet, maar verbetert het. Alleen als er geen kennis bestaat om dit te doen, gebruikt DQS een scheidingsteken om het parseren uit te voeren. In sommige gevallen kan DQS een bepaalde parsering bepalen door op kennis gebaseerde parsering en vervolgens andere parseren door op scheidingstekens gebaseerde parsering te bepalen.

Op kennis gebaseerde parsering kan worden gebruikt wanneer het samengestelde domein bestaat uit tekenreeksdomeinen of wanneer het samengestelde domein bestaat uit een combinatie van verschillende typen domeinen (int, datum, tijd, enzovoort). Als de gegevensbron uit verschillende typen gegevens bestaat, moet de parsering eerst worden uitgevoerd voor de niet-tekenreeksgegevenstypen en vervolgens zoals hierboven beschreven op basis van domeinkennis voor de rest van de gegevens.

Wanneer u op kennis gebaseerde parsering gebruikt en er minder waarden zijn in de brongegevens dan er domeinen in het samengestelde domein zijn, plaatst DQS een null in het ontbrekende domein. Wanneer er meer waarden in de brongegevens zijn dan er domeinen in het samengestelde domein zijn, worden de extra gegevens door DQS toegevoegd aan een van de kolommen. Als twee of meer domeinen dezelfde waarden bevatten, wordt de gegevensbron geparseerd naar het eerste overeenkomende domein.