Delen via


Data catalogus

De gegevenscatalogus registreert en onderhoudt de gegevensgegevens op een gecentraliseerde locatie en maakt deze beschikbaar voor de organisatie. Het zorgt ervoor dat ondernemingen dubbele gegevensproducten voorkomen die worden veroorzaakt door redundante gegevensopname door verschillende projectteams. U wordt aangeraden een gegevenscatalogusservice te maken om de metagegevens te definiëren van de gegevensproducten die zijn opgeslagen in de landingszones voor gegevens.

Cloudanalyses zijn afhankelijk van Microsoft Purview om zakelijke gegevensbronnen te registreren, ze te classificeren, gegevenskwaliteit te garanderen en veilige, selfservicetoegang te bieden.

Microsoft Purview is een tenantservice en kan communiceren met elke gegevenslandingszone door een beheerd virtueel netwerk te maken dat is geïmplementeerd in de regio van uw gegevenslandingszones. U kunt Azure Managed Virtual Network Integration Runtimes (IR) implementeren binnen Microsoft Purview Managed Virtual Networks in elke beschikbare Microsoft Purview-regio. Van daaruit kan de ir van het beheerde virtuele netwerk privé-eindpunten gebruiken om veilig verbinding te maken met de ondersteunde gegevensbronnen en deze te scannen. Zie Beheerde virtuele netwerken gebruiken met uw Microsoft Purview-account voor meer informatie. Het maken van een beheerde virtuele netwerk-IR in Managed Virtual Network zorgt ervoor dat het proces voor gegevensintegratie geïsoleerd en veilig is.

Wanneer u Azure Databricks gebruikt, raden we u aan Azure Databricks Unity Catalog naast Microsoft Purview te gebruiken. Azure Databricks Unity Catalog biedt gecentraliseerd toegangsbeheer, controle, herkomst en mogelijkheden voor gegevensdetectie in Databricks-werkruimten. Zie best practices voor Unity Catalogvoor aanbevolen procedures voor het instellen van Unity Catalog.

Notitie

Hoewel deze documentatie voornamelijk gericht is op het gebruik van Microsoft Purview voor governance, hebben ondernemingen mogelijk geïnvesteerd in andere producten, zoals Alation, Okera of Collibra. Deze oplossingen zijn gebaseerd op abonnementen en we raden u aan deze te implementeren in de landingszone voor gegevensbeheer. Houd er rekening mee dat er mogelijk een aangepaste integratie vereist is.

Gegevensdetectie

Gegevensdetectie weerspiegelt de status van alle gegevens waarvan de onderneming eigenaar is. Deze gegevens worden de gegevensdomein genoemd. Tijdens gegevensdetectie wordt de gegevensomgeving gescand en geclassificeerd. Het proces voor het scannen van gegevens maakt rechtstreeks verbinding met de gegevensbron volgens een vast schema.

Wanneer u een nieuwe gegevenslandingszone aan de omgeving toevoegt, moeten de gekoppelde data lakes en polyglot persistentiebronnen worden geregistreerd als bronnen voor de datacataloguscrawlers die moeten worden gescand.

Met geautomatiseerde detectie van uw gegevensomgeving om de catalogus te vullen, kunt u het volgende doen:

  • Metagegevens verkennen vanuit Azure- en on-premises gegevensbronnen
  • Uw data lakes, blobs en andere ondersteunde doelen scannen
  • Schema extraheren uit uw gegevensdoelen voor XML-, TSV-, CSV-, PSV-, SSV-, JSON-, Parquet-, Avro- en ORC-bestandstypen
  • Automatische catalogusupdates toestaan via configureerbare planning van scans en scanregelsets

Belangrijk

Wanneer u een nieuwe gegevenslandingszone toevoegt aan de omgeving, registreert u de gekoppelde data lakes en polyglot opslag via Azure DevOps als bron voor de datacataloguscrawlers om te scannen, te beheren en gegevensintegriteit te waarborgen.

Gegevensclassificatie

Met Microsoft Purview kunt u systeem- of aangepaste gegevensclassificaties toepassen op bestands-, tabel- of kolomassets.

Gegevensclassificaties zijn net als onderwerptags. Microsoft Purview markeert en identificeert de inhoud van specifieke gegevenstypen die tijdens het scannen in uw gegevensomgeving zijn gevonden. U gebruikt vertrouwelijkheidslabels om de categorieën classificatietypen binnen uw organisatiegegevens te identificeren. U kunt ook vertrouwelijkheidslabels gebruiken om het beleid te groeperen dat u op elke categorie wilt toepassen. Microsoft Purview maakt gebruik van dezelfde typen gevoelige informatie als Microsoft 365, zodat u uw bestaande beveiligingsbeleid en -beveiligingen kunt uitbreiden voor uw hele inhoud en gegevensomgeving.

Microsoft Purview kan documenten scannen en automatisch classificeren. Als u bijvoorbeeld een bestand hebt met de naam multiple.docx en het een nationaal id-nummer bevat in de inhoud, voegt Microsoft Purview een classificatie toe, zoals EU National Identification Number op de detailpagina van de asset.

Microsoft Defender voor SQL is een functie die beschikbaar is voor Azure SQL Database, Azure SQL Managed Instance en Azure Synapse Analytics. Het bevat functionaliteit voor het detecteren en classificeren van gevoelige gegevens, het zichtbaar maken en inperken van potentiële beveiligingsproblemen in uw database, en het detecteren van afwijkende activiteiten die kunnen duiden op een bedreiging van de database. Microsoft Defender voor SQL biedt één goto-locatie voor het inschakelen en beheren van deze mogelijkheden.

Volgende stappen