Freigeben über


Datenprodukte in Microsoft Purview

Ein Datenprodukt ist eine Gruppe von Datenassets (Tabellen, Dateien, PBI-Berichte usw.), ein gepacktes Angebot für ein Unternehmen, das Ressourcen mit einem Anwendungsfall bereitstellt, der für Datenconsumer freigegeben werden kann.

In Microsoft Purview ist Datengovernance nicht nur eine Möglichkeit, um sicherzustellen, dass Ihre Daten sicher und konform sind, sondern auch ein Tool, um den Geschäftswert Ihrer Daten zu beschleunigen. Die Katalogisierung von Daten in Ihrem Bestand ermöglicht es, Daten für die richtige Verwendung besser zu verwalten, bietet aber auch ein vollständiges Bild Ihrer Datenlandschaft. Da nun eine Liste aller verfügbaren Datenressources vorhanden ist, müssen sich Benutzer nicht mehr auf Netzwerk- oder Teamkenntnisse verlassen, um das zu finden, was sie benötigen. sie können den Katalog selbst durchsuchen. Aber jedem Benutzer eine rohe Liste aller verfügbaren Daten zu geben, ist überwältigend und nicht von Natur aus nützlich. Selbst bei guten Beschreibungen, Tags und Glossarbegriffen kann es schwierig sein zu wissen, wonach Sie suchen. Und für eine vollständige Datenvisualisierung benötigen Sie wahrscheinlich mehrere Datenressourcen und nicht nur eines. Wenn Unified Catalog wächst, muss der Kontext parallel dazu wachsen, damit Ihre Benutzer die benötigten Daten leichter finden und darauf zugreifen können.

Um eine skalierbare Datenkontext- und Zugriffsverwaltung bereitzustellen, führt Microsoft Purview das Datenprodukt ein.

Was ist ein Datenprodukt?

Ein Datenprodukt ist ein Geschäftskonzept mit einem Namen, einer Beschreibung, Besitzern und vor allem einer Liste der zugeordneten Datenressourcen. Das Datenprodukt stellt Kontext für diese Ressourcen bereit und gruppiert sie unter einem Anwendungsfall für Datenconsumer. Eine Governancedomäne kann viele Datenprodukte enthalten, aber ein Datenprodukt wird von einer einzigen Governancedomäne verwaltet und kann über viele Domänen hinweg ermittelt werden.

Ein erfolgreiches Datenprodukt erleichtert Datenconsumern das Erkennen wertvoller Daten in ihrer täglichen Sprache und optimiert gleichzeitig die Verantwortlichkeiten für diese Datenressourcen. Sehen wir uns an, wie das aussieht.

Skalierbarer Datenkontext

Beispielsweise erstellt ein Data Scientist eine Reihe von Datenassets, die sein Datenmodell nutzen kann, und möchte, dass andere Dasselbe Dataset verwenden können.

Ohne Datenprodukte kann der Data Scientist Unified Catalog verwenden, um allen relevanten Datenressourcen einen Glossarbegriff hinzuzufügen. Ein Benutzer weiß möglicherweise nicht, welcher Glossarbegriff gesucht werden soll. Daher ist es möglicherweise am besten, jeder Datenressource eine Beschreibung hinzuzufügen, um es bei der Suche nach ähnlichen Informationen relevanter zu machen. Beide Ergänzungen garantieren jedoch nicht, dass anderen Benutzern alle zugeordneten Datenressourcen angezeigt werden. Sie können sich in anderen Ressourcen gruppieren, die nicht so relevant sind, oder ein kritisches Datenstück verpassen und Zeit damit verbringen, die Forschung zu wiederholen, die der ursprüngliche Data Scientist bereits durchgeführt hat.

Mit einem Datenprodukt kann ein Data Scientist ein Datenprodukt erstellen, das alle Ressourcen auflistet, die zum Erstellen seines Datenmodells verwendet wurden. Die Beschreibung enthält einen vollständigen Anwendungsfall mit Beispielen oder Vorschlägen zur Verwendung der Daten. Der Data Scientist ist jetzt Besitzer eines Datenprodukts und hat die Sucherfahrung seiner Datenverbraucher verbessert, indem er ihnen hilft, alles zu erhalten, was er in diesem einen Datenprodukt benötigt.

Skalierbare Datengovernance

Datenprodukte optimieren auch die Governance für Datenressourcen. Verwenden Sie das gleiche Beispiel eines Data Scientists, der eine Reihe von Datenassets erstellt:

Wenn ein Benutzer ohne Datenprodukte Zugriff auf die Datenassets für das Dataset wünscht, muss er den Zugriff auf jede Datenressource einzeln anfordern. Ein Datenbesitzer weiß möglicherweise, dass diese Ressourcen für Machine Learning-Modelle verwendet werden. Wenn jedoch Änderungen an Richtlinien zu seinen Sicherheits- und Anwendungsfällen vorgenommen werden, muss der Datenbesitzer zu jeder Ressource einzeln wechseln, um diese Updates vorzunehmen.

Bei Datenprodukten findet ein Benutzer das Datenprodukt, und er kann Zugriff auf das Datenprodukt anfordern, wodurch er (nach genehmigungshalber) Zugriff auf alle zugehörigen Datenressourcen erhält. Wenn mehr Genehmigungs- oder Datennutzungsrichtlinien für Datasets für maschinelles Lernen eingerichtet werden, muss ein Datenbesitzer die neuen Richtlinien nur auf das Datenprodukt anwenden, und sie werden automatisch auf die Ressourcen heruntergefahren.

Datenprodukte sind auch mit Geschäftsintegritätssteuerelementen und OKRs verknüpft. Diese Kontrollen ermöglichen es Datenbesitzern, die Datenintegrität zu bewerten, Ressourcen zu priorisieren, die Aufmerksamkeit erfordern, und zu bewerten, welche Datenressourcen einen geschäftlichen Nutzen bieten. Dies unterstützt nicht nur den Fortschritt hin zu einer vollständigen Datengovernance in Ihrem Bestand, sondern fördert auch die Entwicklung des Geschäftswerts aus Ihren Daten. Ressourcen sind nicht mehr abstrakt, sondern an reale Anwendungsfälle und Geschäftsziele gebunden, auf die sich Ihr Team konzentrieren kann.

Datenzugriffsrichtlinien

Datensicherheit und -zugriff sind der Hauptmandant einer erfolgreichen Datengovernance. Um jedoch Datengovernance zu implementieren und die Datennutzung (und damit den Nutzen zu steigern), muss der Datenzugriffsprozess sicher, bequem und an alle Szenarien in Ihrem gesamten Datenbestand angepasst werden können. Einige Daten sollten allgemein verwendbar und zugänglich sein, und einige müssen streng genehmigt und überwacht werden, um die richtige Verwendung sicherzustellen.

Jedes Datenprodukt verfügt über eine Zugriffsrichtlinie, die bestimmt, wie Benutzer Zugriff anfordern, welche Nutzungsbedingungen für die Daten gelten und wer den Zugriff auf die Daten genehmigen soll. Jede dieser Zugriffsrichtlinien kann für die entsprechende Verwendung angepasst werden und wird in Zukunft weiterentwickelt, um weitere Anwendungsfälle abzudecken. Benutzer müssen lediglich Zugriff innerhalb eines Datenprodukts anfordern auswählen. Sie werden automatisch durch den Prozess weitergeleitet, um den Nutzungsbedingungen zuzustimmen und die Zustimmung der richtigen Parteien zu erhalten.

Weitere Informationen zum Zugriff für Datenprodukte finden Sie im Artikel zum Verwalten Unified Catalog Zugriffsrichtlinien in Microsoft Purview.

Nächste Schritte