Dela via


Begrepp om datakvalitetstjänster

gäller för:SQL Server

Det här avsnittet innehåller en kort sammanfattning av DQS-begrepp (Data Quality Services) inom kunskapshantering, datakvalitetsprojekt och datakvalitetsadministration.

Begrepp för kunskapshantering

DQS-kunskapsbasen är en lagringsplats med metadata som skapas av dataförvaltaren eller IT-proffsen för användning för att förbättra datakvaliteten genom datarensning och datamatchning. DQS-kunskapshantering omfattar de processer som används för att skapa och hantera kunskapsbasen, både på ett datorassisterat sätt och interaktivt.

Kunskapsupptäckt

Kunskapsidentifiering är en datorassisterad process som analyserar exempel på organisationens data för att skapa kunskap om data. När du har fått resultatet av analysen kan du verifiera och förbättra kunskapen och sedan använda den för att utföra datarensning, matchning och profilering. Mer information finns i DQS-kunskapsbaser och domäner.

Domänhantering

Med domänhanteringsprocessen kan du ändra eller utöka den kunskap som har genererats av kunskapsidentifieringsprocessen. Du kan redigera, uppdatera och granska kunskapen interaktivt i en kunskapsbas. En kunskapsbas består av datadomäner som innehåller domänvärden och deras status, domänregler, termbaserade relationer och referensdata. I domänhantering kan du ändra domänegenskaper, koppla referensdata till en domän, hantera domänregler, hantera domänvärden och ange datarelationer samt skapa, ta bort, importera eller exportera domäner. Du kan också använda sammansatta domäner som aggregerar mer än en enda domän. Mer information finns i DQS-kunskapsbaser och domäner.

matchningsprincip

En matchningsprincip innehåller matchningsregler som används för att utföra datadeduplicering. Processen för matchningspolicy gör det möjligt för dig att skapa matchningsregler, finjustera dem baserat på matchningsresultat och profilering av data, samt lägga till policyn i kunskapsbasen. Mer information finns i datamatchning.

Referensdatatjänster

Du kan använda referensdata för att verifiera, korrigera och utöka dina data och utnyttja tjänster från företag som garanterar kvaliteten på deras referensdata. Du kan använda Azure Marketplace-tjänsterna för att ansluta till referensdataleverantörer, eller så kan du använda en direktanslutning till en provider. Mer information finns i Reference Data Services i DQS.

Mer information om kunskapshantering i DQS finns i DQS-kunskapsbaser och domäner.

Projektkoncept för datakvalitet

Dataförvaltaren utför datakvalitetsåtgärder (rensning och matchning) med hjälp av ett datakvalitetsprojekt i datakvalitetsklientprogrammet.

datarensning

Datarensning i DQS görs baserat på kunskapen i en DQS-kunskapsbas. Datarensning i DQS är en tvåstegsprocess:

  • Datorstödd rensning: DQS använder kunskapen i den valda kunskapsbasen för rensningsprojektet för att föreslå korrigeringar/förslag på värdena i en datakälla.

  • Interaktiv rensning: Dataförvaltaren kan utföra den interaktiva rensningsprocessen för att ändra eller utöka datakorrigeringar som har föreslagits av den datorstödda datarensningsprocessen. Dataförvaltaren gör det med hjälp av konfidensnivåer och statistik som identifieras av datarensningsprocessen, eller genom att manuellt ange sina egna ändringar i projektet.

Efter rensning av data kan dataförvaltaren exportera bearbetade data till en SQL Server-databas, .csveller en Excel-fil. Mer information finns i Datarens.

Datamatchning

Matchningsprocessen gör det möjligt för dataförvaltaren att jämföra data så att liknande, men något annorlunda, data kan justeras genom en dedupliceringsprocess. DQS utför deduplicering baserat på matchningsregler som finns i kunskapsbasen. dataförvaltaren anger parametrar för matchningsprocessen inifrån ett datakvalitetsprojekt. Mer information finns i datamatchning.

profilering och meddelanden

Dataprofilering ger dataförvaltare realtidsstatistik och information om de data som bearbetas av DQS för rensning eller matchande aktiviteter när du kör ett datakvalitetsprojekt. Dataprofilering hjälper dig att utvärdera effektiviteten i rensnings- och matchningsaktiviteterna i ett datakvalitetsprojekt, och meddelanden hjälper användaren med åtgärder som kan vidtas för att förbättra datarensningen och datamatchningsaktiviteterna. För mer information, se Dataprofilering och meddelanden i DQS.

Mer information om datakvalitetsprojekt i DQS finns i Data Quality Projects (DQS).

Begrepp för datakvalitetsadministration

En DQS-administratör kan utföra olika administrativa uppgifter med hjälp av klientprogrammet för datakvalitet.

aktivitetsövervakning

Aktivitetsövervakning visar status och tillstånd för varje aktivitet som utförs inom ett dataintervall, tillhandahåller data för varje aktivitet och gör det möjligt för DQS-administratörer att kontrollera en aktivitet. För mer information, se Övervaka DQS-aktiviteter.

Konfiguration

Med alternativet Konfiguration kan du:

DQS Security

Du använder roller inom SQL Server-säkerhetsmekanismen för att göra DQS säkert. Det finns tre DQS-roller som avgör åtkomstnivån för en användare i klientprogrammet för datakvalitet: dqs_administrator, dqs_kb_editor och dqs_kb_operator. Du kan inte bevilja roller till användarna med hjälp av datakvalitetsklientprogrammet. det görs med SQL Server Management Studio. Mer information finns i DQS Security.

Mer information om DQS-administration finns i DQS Administration.

Se även

Datakvalitetstjänster