Dela via


Skapa en sammansatt domän

gäller för:SQL Server

Det här avsnittet beskriver hur du skapar en sammansatt domän i en kunskapsbas i Data Quality Services (DQS). En sammansatt domän består av en eller flera enskilda domäner som gäller för ett enda datafält. Mer information om sammansatta domäner finns i Hantera en sammansatt domän.

Det finns två sätt att skapa en ny sammansatt domän. Den första är under kartläggningssteget i aktiviteten för kunskapsupptäckt när du analyserar ett dataurval för att lägga till kunskap i en ny eller befintlig kunskapsbas. Den andra är under domänhanteringsaktiviteten, när du i stället för att ändra en befintlig domän skapar en ny. För att kunna skapa en sammansatt domän måste du redan ha skapat minst två enskilda domäner att lägga till i den sammansatta domänen. Endast de enskilda domäner som redan har skapats och som inte har lagts till i en befintlig sammansatt domän är tillgängliga när du skapar en ny sammansatt domän. Det går inte att lägga till en enskild domän i mer än en sammansatt domän och en sammansatt domän kan inte läggas till i en annan sammansatt domän.

När du har skapat en sammansatt domän kan du ändra egenskaperna för den sammansatta domänen, koppla en referensdatatjänst till domänen, skapa regler mellan domäner eller skapa värderelationer. Om du vill göra det väljer du den sammansatta domänen i listan Domän på sidan Domänhantering och väljer lämplig flik.

Innan du börjar

Förutsättningar

Om du vill skapa en sammansatt domän måste du ha skapat och öppnat en kunskapsbas och du måste ha skapat minst två enskilda domäner för att kunna lägga till den sammansatta domänen.

Säkerhet

Behörigheter

Du måste ha dqs_kb_editor- eller dqs_administrator-rollen i DQS_MAIN-databasen för att skapa en sammansatt domän.

Skapa en sammansatt domän i kunskapsidentifieringsaktiviteten

  1. Starta datakvalitetsklienten. Information om hur du gör det finns i Kör klientprogrammet för datakvalitet.

  2. På startskärmen för datakvalitetsklient klickar du på Öppna kunskapsbasen och väljer sedan en kunskapsbas eller klickar på Ny kunskapsbas och anger egenskaper för den nya kunskapsbasen.

  3. Välj Knowledge Discovery som aktivitet och klicka sedan på Skapa för att skapa den nya kunskapsbasen eller Öppna för att öppna en befintlig kunskapsbas.

  4. På sidan Map anger du en anslutning till datakällan. Mer information finns i Utföra kunskapsidentifiering.

  5. I tabellen Mappningar väljer du en källkolumn i listrutan för kolumnen Källkolumn i en tom rad. Kontrollera att källkolumnen innehåller en sammansatt domän som hanteras av två befintliga enskilda domäner. Om det inte finns några motsvarande enskilda domäner klickar du på ikonen Skapa en domän.

  6. I tabellen Mappningar väljer du en källkolumn i listrutan för kolumnen Källkolumn i en tom rad. Kontrollera att källkolumnen innehåller sammansatta domändelar som hanteras av två befintliga enskilda domäner. Om det inte finns några motsvarande enskilda domäner klickar du på ikonen Skapa en domän för att skapa dem. Mer information finns i Skapa en domän.

  7. Klicka på ikonen Skapa en sammansatt-domän.

Skapa en sammansatt domän i domänhanteringsaktiviteten

  1. På startsidan för Data Quality Services-klienten klickar du på Öppna kunskapsbasen och väljer sedan en kunskapsbas eller klickar på Ny kunskapsbas och anger egenskaper för den nya kunskapsbasen.

  2. Välj Domänhantering som aktivitet och klicka sedan på Skapa för att skapa den nya kunskapsbasen eller Öppna för att öppna en befintlig kunskapsbas.

  3. Se till att det finns två eller flera enskilda domäner som krävs av den sammansatta domänen. Om du inte redan har gjort det, klicka på ikonen Skapa en domän för att skapa dem. Mer information finns i Skapa en domän.

  4. På sidan Domain Management klickar du på ikonen Skapa en sammansatt domän ovanför listan Domän.

  5. Ange ett namn som är unikt för kunskapsbasen och en beskrivning på upp till 256 tecken.

  6. I listan domänerväljer du de domäner som ska ingå i den sammansatta domänen och klickar på högerpilen för att flytta dem till tabellen Domäner i sammansatt domän.

  7. Klicka på OK.

Ange egenskaper för sammansatt domän

  1. I dialogrutan Skapa en sammansatt domän anger du ett namn som är unikt för kunskapsbasen och en beskrivning på upp till 256 tecken.

  2. I listan domänerväljer du de domäner som ska ingå i den sammansatta domänen och klickar på högerpilen för att flytta dem till tabellen Domäner i sammansatt domän. Det här är en lista över enskilda domäner som är tillgängliga för att läggas till i den sammansatta domän som du skapar. Endast de enskilda domäner som redan har skapats och som inte har lagts till i en befintlig sammansatt domän är tillgängliga. Det går inte att lägga till en enda domän i mer än en sammansatt domän i kunskapsbasen och en sammansatt domän kan inte läggas till i en annan sammansatt domän.

  3. Klicka på Avancerat.

  4. Välj något av följande för parsningsmetod:

    • Referensdata: Parsa fältets värden beroende på hur data formateras av referensdatatjänsten (RDS). Data Quality Services skickar värdena i den sammansatta domänen till RDS och RDS returnerar data korrigerade och parsade enligt domänen i den sammansatta domänen.

    • I ordning: Parsa fältets värden enligt ordningen på domäner i den sammansatta domänen. Det första värdet inkluderas i den första domänen, det andra värdet i de andra domänerna och så vidare.

    • Avgränsare: Tolka fältets värden baserat på den avgränsare som valts från de alternativknappar som visas när Avgränsare är valt. Kan vara Tab, semikolon, kommatecken, blankstegeller något annat. Om Andraanger du det värde som ska fungera som avgränsare.

  5. Om du har valt Avgränsare för parsningsmetoden kan du också välja Använda kunskapsbaserad parsning. Mer information finns i Knowledge-Based Parsing.

  6. Klicka på Slutför för att slutföra domänhanteringsaktiviteten enligt beskrivningen i Avsluta domänhanteringsaktiviteten.

Följ upp: När du har skapat en sammansatt domän

När du har skapat en sammansatt domän kan du utföra andra domänhanteringsuppgifter på domänen, du kan utföra kunskapsidentifiering för att lägga till kunskap i domänen eller lägga till en matchande princip i domänen. Mer information finns i Utföra kunskapsidentifiering, Hantera en domäneller Skapa en matchande princip.

Knowledge-Based Parsning

Med Data Quality Services kan du parsa data baserat på kunskap, inte bara på avgränsare eller ordning. Kunskapsbaserad parsning används när komplexa källdata mappas till en sammansatt domän och du inte använder referensdatatjänster. Du kan använda kunskapsbaserad parsning för att parsa data från datakällan till relevanta enskilda domäner. Med kunskapsbaserad parsning försöker DQS först använda kunskap för att parsa komplexa data i enskilda domäner. Om möjligt identifierar den delar av strängen som i en eller flera domäner och parsar strängen i dess olika domäner. Anta till exempel att du har "John B. Doe" som komplexa värden i ett fullständigt namnfält som representeras av en sammansatt domän med fullständigt namn. Om DQS identifierar "John" som i förnamnsdomänen och "Doe" som i efternamnsdomänen, lägger DQS till "B" i mellannamnsdomänen baserat på domänkunskap.

Du kan bara använda kunskapsbaserad parsning om du också väljer avgränsarbaserad parsning. Kunskapsbaserad parsning ersätter inte avgränsarparsering, utan förbättrar den. Endast om det inte finns någon kunskap för att göra det kommer DQS att använda en avgränsare för att utföra parsningen. I vissa fall kan DQS fastställa viss parsning genom kunskapsbaserad parsning och sedan fastställa annan parsning genom avgränsarbaserad parsning.

Kunskapsbaserad parsning kan användas när den sammansatta domänen består av strängdomäner eller när den sammansatta domänen består av en blandning av olika typer av domäner (int, datum, tid osv.). Om datakällan består av olika typer av data bör parsningen först utföras för datatyper som inte är strängdata och sedan enligt beskrivningen ovan baserat på domänkunskap för resten av data.

När du använder kunskapsbaserad parsning och det finns färre värden i källdata än det finns domäner i den sammansatta domänen, placerar DQS en null i den saknade domänen. När det finns fler värden i källdata än det finns domäner i den sammansatta domänen lägger DQS till extra data i en av kolumnerna. Om två eller flera domäner innehåller samma värden parsas datakällan till den första matchade domänen.