Gegevensherkomst
Gegevensherkomst speelt een belangrijke rol in analyses op cloudschaal. Herkomst toont afhankelijkheden tussen onbewerkte gegevens en eindproducten, waarin de transformaties en manipulaties worden beschreven die onbewerkte gegevens omzetten in eindproducten. Gegevensherkomst omvat de levenscyclus van gegevens, van de oorsprong tot de verplaatsing van de gegevens over de gegevensomgeving. Het wordt gebruikt voor probleemoplossing, hoofdoorzaakanalyse, analyse van gegevenskwaliteit, naleving en impactanalyse. Er wordt ook context toegevoegd aan datasets en producten, waardoor gegevensproducten vindbaar zijn en zelfbediening mogelijk maken.
Een primaire functie van elke gegevenscatalogus is de mogelijkheid om de herkomst tussen gegevensproducten weer te geven.
Microsoft Purview-gegevenscatalogus maakt verbinding met verschillende systemen voor gegevensverwerking, opslag en analyse om herkomstinformatie te extraheren. Het doel is om de verplaatsing, transformatie en operationele metagegevens van elk gegevenssysteem weer te geven.
Azure Data Factory- en Azure Synapse-pijplijnen worden aanbevolen voor opnameoplossingen omdat ze gegevensherkomst in Microsoft Purview inschakelen. Alternatieve opnamepatronen zouden de Apache Atlas-API moeten benutten om gegevensherkomst bij te werken als onderdeel van hun gegevensverwerking.
Microsoft Fabric biedt ondersteuning voor herkomst zonder dat Microsoft Purview is vereist. Als u één locatie nodig hebt om herkomst weer te geven, raden we u aan Microsoft Purview in te stellen om een Microsoft Fabric-tenant te scannen, omdat deze instelling automatisch metagegevens en herkomst van Fabric-items, waaronder Power BI, in Microsoft Purview-gegevenscatalogus invoert. Zie Herkomst in Fabric en Herkomst ophalen van Microsoft Fabric-items in Microsoft Purviewvoor meer informatie.
Tip
Zie Gegevensherkomst in Microsoft Purview voor meer informatie over ondersteunde systemen en aanbevolen procedures.
Volgende stappen
Meer informatie over het beheren van hoofdgegevens in Azure.