Delen via


Concepten van Data Quality Services

van toepassing op:SQL Server-

Dit onderwerp bevat een kort overzicht van DQS-concepten (Data Quality Services) in kennisbeheer, projecten voor gegevenskwaliteit en beheer van gegevenskwaliteit.

Concepten voor kennisbeheer

De DQS Knowledge Base is een opslagplaats met metagegevens die door de data-steward of IT-professional wordt gemaakt voor het verbeteren van de gegevenskwaliteit door gegevensopschoning en gegevenskoppeling. DQS-kennisbeheer omvat de processen die worden gebruikt voor het maken en beheren van de knowledge base, zowel op een computer-ondersteunde manier als interactief.

Knowledge Discovery

Kennisdetectie is een computergeassisteerd proces waarmee voorbeelden van de gegevens van uw organisatie worden geanalyseerd om kennis over de gegevens op te bouwen. Zodra u de resultaten van de analyse hebt, kunt u de kennis valideren en verbeteren en deze vervolgens toepassen om gegevens op te schonen, te vergelijken en profileren uit te voeren. Zie DQS Knowledge Bases en domeinenvoor meer informatie.

Domeinbeheer

Met het domeinbeheerproces kunt u de kennis wijzigen of uitbreiden die is gegenereerd door het kennisdetectieproces. U kunt de kennis interactief bewerken, bijwerken en controleren in een knowledge base. Een knowledge base bestaat uit gegevensdomeinen die domeinwaarden en hun status, domeinregels, termenrelaties en referentiegegevens bevatten. In domeinbeheer kunt u domeineigenschappen wijzigen, referentiegegevens koppelen aan een domein, domeinregels beheren, domeinwaarden beheren en gegevensrelaties invoeren, en domeinen maken, verwijderen, importeren of exporteren. U kunt ook samengestelde domeinen gebruiken die meer dan één domein aggregeren. Zie DQS Knowledge Bases en domeinenvoor meer informatie.

Matchingbeleid

Een overeenkomend beleid bevat de overeenkomende regels die worden gebruikt om gegevensontdubbeling uit te voeren. Met het overeenkomende beleidsproces kunt u overeenkomende regels maken, deze verfijnen op basis van overeenkomende resultaten en profileringsgegevens en het beleid toevoegen aan de Knowledge Base. Zie Data Matchingvoor meer informatie.

Reference Data Services

U kunt referentiegegevens gebruiken om uw gegevens te valideren, te corrigeren en te verrijken, waarbij gebruik wordt gemaakt van de services van bedrijven die de kwaliteit van hun referentiegegevens garanderen. U kunt de services van Azure Marketplace gebruiken om verbinding te maken met referentiegegevensproviders of u kunt een directe verbinding met een provider gebruiken. Zie Reference Data Services in DQSvoor meer informatie.

Zie DQS Knowledge Bases and Domainsvoor meer informatie over kennisbeheer in DQS.

Projectconcepten voor gegevenskwaliteit

De gegevenssteward voert gegevenskwaliteitsbewerkingen (opschonen en vergelijken) uit met behulp van een gegevenskwaliteitsproject in de toepassing Data Quality Client.

gegevensopschoning

Gegevensopschoning in DQS wordt uitgevoerd op basis van de kennis in een DQS-knowledge base. Gegevensopschoning in DQS is een proces in twee stappen:

  • computergestuurde opschoning: DQS gebruikt de kennis in de geselecteerde knowledge base voor het opschoningsproject om correcties/suggesties voor de waarden in een gegevensbron voor te stellen.

  • Interactive Cleansing: De gegevenssteward kan het interactieve opschoningsproces uitvoeren om gegevenscorrecties te wijzigen of aan te vullen die zijn voorgesteld door het computergestuurde gegevensopschoningsproces. De gegevenssteward doet dit door betrouwbaarheidsniveaus en statistieken te gebruiken die worden geïdentificeerd door het gegevensopschoningsproces, of door handmatig hun eigen wijzigingen in het project in te voeren.

Na het opschonen van gegevens kan de data-steward de verwerkte gegevens exporteren naar een SQL Server-database, .csvof een Excel-bestand. Zie gegevensopschoningvoor meer informatie.

gegevenskoppeling

Met het afstemmingsproces kan de gegevenssteward vergelijkbare, maar iets verschillende gegevens vergelijken en afstemmen via een ontdubbelingsproces. DQS voert ontdubbeling uit op basis van overeenkomende regels in de knowledge base; de gegevenssteward geeft parameters op voor het overeenkomende proces vanuit een gegevenskwaliteitsproject. Zie Data Matchingvoor meer informatie.

profilering en meldingen

Gegevensprofilering biedt realtime statistieken en informatie over de gegevens die worden verwerkt door DQS voor het opschonen of vergelijken van activiteiten tijdens het uitvoeren van een project voor gegevenskwaliteit. Met gegevensprofilering kunt u de effectiviteit van de opschonings- en overeenkomende activiteiten in een project voor gegevenskwaliteit beoordelen, en meldingen helpen de gebruiker met acties die kunnen worden ondernomen om de gegevens op te schonen en gegevens te vergelijken. Zie Gegevensprofilering en -meldingen in DQS-voor meer informatie.

Zie DQS-voor meer informatie over projecten voor gegevenskwaliteit in DQS.

Concepten voor gegevenskwaliteitsbeheer

Een DQS-beheerder kan verschillende beheertaken uitvoeren met behulp van de toepassing Data Quality Client.

activiteitenbewaking

Activiteitscontrole geeft de status en status weer van elke activiteit die wordt uitgevoerd binnen een gegevensbereik, levert gegevens voor elke activiteit en stelt DQS-beheerders in staat om een activiteit te beheren. Voor meer informatie, zie DQS-activiteiten monitoren.

Configuratie

Met de optie Configuratie kunt u het volgende doen:

DQS Security

U gebruikt rollen binnen het SQL Server-beveiligingsmechanisme om DQS veilig te maken. Er zijn drie DQS-rollen die het toegangsniveau bepalen voor een gebruiker in de toepassing Data Quality Client: dqs_administrator, dqs_kb_editor en dqs_kb_operator. U kunt geen rollen toekennen aan gebruikers met de toepassing Data Quality Client; dat wordt gedaan met SQL Server Management Studio. Zie DQS Securityvoor meer informatie.

Zie DQS Administrationvoor meer informatie over DQS-beheer.

Zie ook

Data Quality Services