Beschreiben von Microsoft Purview Data Catalog
Das Ziel von Microsoft Purview Data Catalog besteht darin, eine Plattform für Data Governance bereitzustellen und die Geschäftswertschöpfung in Ihrer Organisation zu fördern. Dies geschieht mithilfe einer Vielzahl von Features, die den Data Governance-Prinzipien entsprechen. In den folgenden Abschnitten werden einige der wichtigsten Features von Microsoft Purview Data Catalog beschrieben.
Governancedomänen
Governancedomänen: Governancedomänen sind eine neue Möglichkeit, Ihre Datenbestände mit Geschäftskonzepten wie Marketing oder Finanzen zu organisieren und Kontext für Ihre Datenressourcen bereitzustellen. Eine Governancedomäne ist eine Grenze, die Einheitlichkeit von Governance, Besitz und Erkennung von Datenprodukten und Geschäftskonzepten wie Glossarbegriffen, OKRs oder kritischen Daten ermöglicht. Sie können viele verschiedene Grenzen festlegen, z. B. folgende:
- Grundlegende Geschäftsbereiche: Personalmanagement, Vertrieb, Finanzen, Lieferkette usw.
- Übergeordnete Themenbereiche: Produkt, Parteien usw.
- Grenzen basierend auf Organisationsfunktionen: Kundenfreundlichkeit, Cloudlieferkette, Business Intelligence usw.
Geschäftsdomänen sind mit mehreren anderen Geschäftskonzepten verbunden, die als Features von Data Catalog integriert sind.
Datenprodukte
Datenprodukte stehen im Zusammenhang mit Geschäftsdomänen. Ein Datenprodukt ist ein Geschäftskonstrukt mit einem Namen, einer Beschreibung, Besitzern und – besonders wichtig – einer Liste der zugeordneten Datenressourcen. Das Datenprodukt stellt Kontext für die darin enthaltenen Ressourcen und einen Anwendungsfall für Datenconsumer bereit.
Eine Governancedomäne kann viele Datenprodukte enthalten, aber ein Datenprodukt wird von einer einzigen Governancedomäne verwaltet und kann in vielen Domänen ermittelt werden.
Ein erfolgreiches Datenprodukt erleichtert es Datenconsumern, wertvolle Daten mithilfe ihrer täglichen Sprache zu erkennen. Gleichzeitig optimiert es die Besitzverantwortlichkeiten für diese Datenressourcen.
Betrachten Sie das Beispiel, in dem eine wissenschaftliche Fachkraft für Daten eine Reihe von Datenressourcen erstellt hat, die von einem Datenmodell und anderen Benutzern verwendet werden sollen. Die wissenschaftliche Fachkraft für Daten kann den Datenkatalog verwenden, um allen relevanten Datenressourcen einen Glossarbegriff und jeder Ressource eine Beschreibung hinzuzufügen, um sie relevanter für die Suche nach ähnlichen Informationen zu machen. Dies garantiert jedoch nicht, dass ein Datenconsumer weiß, welcher Glossarbegriff verwendet werden soll, oder dass der Datenconsumer alle Datenressourcen findet. Hier ist ein Datenprodukt geeignet. Die wissenschaftliche Fachkraft für Daten erstellt ein Datenprodukt, das alle Ressourcen auflistet, die zum Erstellen ihres Datenmodells verwendet werden. Die Beschreibung enthält einen vollständigen Anwendungsfall mit Beispielen oder Vorschlägen zur Verwendung der Daten. Die wissenschaftliche Fachkraft für Daten ist jetzt ein Datenproduktbesitzer und hat die Sucherfahrung der Datenconsumer verbessert, indem sie ihnen hilft, alles Benötigte in diesem einzigen Datenprodukt zu erhalten.
Glossarbegriffe
Glossarbegriffe bieten kritischen Geschäftskontext für Ihre Datenressourcen und wenden darüber hinaus Richtlinien an, die bestimmen, wie Ihre Daten verwaltet und für die Verwendung auffindbar gemacht werden sollen.
Bei Glossarbegriffen handelt es sich um einzelne Konzepte, die das Geschäft, die Prozesse und die Systeme in einer Organisation definieren. Sie können im gesamten Datenbestand angewendet werden und beziehen sich auf Datenressourcen und Datenprodukte, um Ihren Benutzern Geschäftskontext zu bieten.
Begriffe werden in Governancedomänen erstellt, um spezifischen Kontext für jeden Teil Ihrer Organisation zu kreieren. Beispielsweise können sowohl Vertrieb als auch Marketing denselben Begriff verwenden, um Unterschiedliches auszudrücken, und Ihre Governancedomänen helfen Ihrem Team, zwischen diesen Bedeutungen zu unterscheiden. Nach dem Erstellen werden die Begriffe Datenprodukten zugeordnet, um Kontext für diese bereitzustellen und basierend auf dem Geschäftskontext spezifische Data Governance zu bieten.
Glossarbegriffe stellen Data Governance basierend auf dem Geschäftskontext bereit, da sie jetzt Richtlinien enthalten. Richtlinien in einem Geschäftsbegriff wenden bestimmte Geschäftsintegritätsziele, Data Governance-Anforderungen und Nutzungsbedingungen auf jedes Datenprodukt an, für das der Begriff verwendet wird.
Kritische Datenelemente
Nicht alle Datenelemente sind gleich wichtig oder vertraulich, und das Dedizieren von Ressourcen zum willkürlichen Verwalten der Qualität aller Daten kann unpraktisch und kostspielig sein. Bei kritischen Datenelementen (CDEs) handelt es sich um eine logische Gruppierung wichtiger Informationen in Ihrem gesamten Datenbestand. Mithilfe dieser Gruppierungen können Daten einfacher verstanden und die Standardisierung gefördert werden. Datenqualitätsregeln und Zugriffsrichtlinien können diesen Elemente hinzugefügt werden, um vertrauliche Informationen in Ihrem gesamten Datenbestand besser zu sichern.
Beispiel: Ein kritisches Datenelement namens „Customer ID“ kann „CustID“ aus einer Tabelle und „CID“ aus einer anderen Tabelle demselben logischen Container zuordnen. Benutzer können diesen Wert in Datenressourcen abgleichen, um Verbindungen herzustellen. Wenn Datenproduzenten eine neue Ressource erstellen, können sie dieses Element als Blaupause verwenden, um Informationen zur Qualität im richtigen Format bereitzustellen.
Kritische Datenelemente werden innerhalb von Governancedomänen erstellt und können über festgelegte Richtlinien verfügen, um diese wichtigen Informationen zu verwalten.
Durch das Erstellen von CDEs können Organisationen Ressourcen strategisch zuordnen und sich bei der Governance auf die Bereiche konzentrieren, die die stärksten Auswirkungen auf das Unternehmen haben.
OKRs
OKRs (Objectives and Key Results) in Microsoft Purview sind nachverfolgbare Geschäftsziele, die an Governancedomänen und Datenprodukte gebunden sind, um den Wert von Geschäftsdaten hervorzuheben.
OKRs verknüpfen Datenprodukte direkt mit realen Geschäftszielen, um die Lücke zwischen Unternehmen und Datenbestand zu schließen. Die Data Governance ist nicht nur eine IT-Aufgabe oder bewährte Methode in der Technik, sondern ein wichtiger Bestandteil der Wertschöpfung.
Datenzugriffsrichtlinien
Mithilfe von Datenkatalog-Zugriffsrichtlinien können Sie den Zugriff auf Ihre Datenprodukte verwalten und ein System einrichten, um Benutzern Zugriff zu gewähren, die ihn anfordern. Fördern Sie Innovation und Flexibilität in Ihrem Datenbestand, indem Sie Self-Service-Zugriffsmöglichkeiten schaffen und gleichzeitig Sicherheit und Standards für die korrekte Nutzung wahren.
Suchen und Durchsuchen
Datenerkennung kann zeitaufwändig sein, da Sie möglicherweise nicht wissen, wo die gewünschten Daten zu finden sind. Die Suche ermöglicht es Datenconsumern, die für ihre Analyse- oder Governanceworkloads benötigten Daten leicht zu finden. Die Suche ist gut geeignet, wenn Sie wissen, wonach Sie suchen, aber manchmal möchten Datenconsumer die verfügbaren Daten erkunden. In der Microsoft Purview Data Catalog-Anwendung können Benutzer*innen die für sie verfügbaren Daten durchsuchen – entweder nach Sammlung oder über die Hierarchie jeder Datenquelle im Katalog.
Integritätsverwaltung
Die Integritätsverwaltung verfügt über Features zum Verbessern Ihrer Data Governance-Strategie und -Verwaltung.
Integritätssteuerung: Mithilfe von Datenintegritätssteuerungen kann Ihr Team Ihre Journey zur vollständigen Data Governance analysieren und nachverfolgen, indem Sie Ihre Governanceintegrität überwachen und die bereitgestellten Integritätssteuerungen verwenden. Bei Datenintegritätssteuerungen handelt es sich um spezifische Maßnahmen, Prozesse und Tools, die zum Überwachen, Aufrechterhalten und Verbessern der Qualität, Sicherheit und allgemeinen Integrität der Daten einer Organisation implementiert werden.
Zu den Vorteilen von Datenintegritätssteuerungen gehören die folgenden:
- Verbesserte Datenqualität: Stellt sicher, dass Daten für die Entscheidungsfindung korrekt, konsistent und zuverlässig bleiben
- Erhöhte Sicherheit: Schützt vertrauliche Daten vor Lecks, unbefugtem Zugriff und Beschädigung
- Einhaltung gesetzlicher Vorschriften: Unterstützt Organisationen dabei, rechtliche und branchenspezifische Standards für die Datenverwaltung einzuhalten
- Betriebliche Effizienz: Reduziert Zeit und Ressourcen, die für die Behebung von Datenproblemen aufgewendet werden, und stellt sicher, dass Daten leicht verfügbar und verwendbar sind.
- Risikominderung: Verhindert kostspielige Fehler und datenbezogene Risiken, die bei schlechter Datenverwaltung auftreten können
Datenintegritätssteuerungen sind wesentliche Komponenten einer umfassenden Data Governance-Strategie, die Organisationen dabei hilft, die Integrität, Sicherheit und Nutzbarkeit ihrer Datenressourcen aufrechtzuerhalten.
Integritätsmaßnahmen: Mithilfe von Maßnahmen zur Integritätsverwaltung können Sie und Ihre Benutzer die Datenintegrität und -governance in Ihrem gesamten Datenbestand verbessern. Diese Maßnahmen entsprechen den Prüfungen, die zum Berechnen der Integritätssteuerungsbewertung der Data Governance eines Datenprodukts vorgenommen werden. Mit diesen Maßnahmen erhöhen Sie Ihre Integritätsbewertung und verbessern die allgemeine Benutzerfreundlichkeit und Auffindbarkeit des Datenkatalogs.
Datenqualität
Microsoft Purview Data Quality ist eine umfassende Lösung, mit der Governancedomänen- und Datenbesitzer die Qualität ihres Datenökosystems bewerten und überwachen und gezielte Maßnahmen zur Verbesserung ergreifen können.
Data Quality bietet Benutzern die Möglichkeit, die Datenqualität mithilfe von No-Code-/Low-Code-Regeln auszuwerten, einschließlich sofort einsatzbereiter (OOB) und KI-generierter Regeln. Diese Regeln werden aggregiert, um Bewertungen für Datenressourcen, Datenprodukte und Governancedomänen bereitzustellen, damit umfassende Sichtbarkeit der Datenqualität innerhalb aller Domänen gewährleistet ist. Microsoft Purview Data Quality enthält auch KI-gesteuerte Datenprofilerstellungsfunktionen.
Durch Nutzen von Microsoft Purview Data Quality können Organisationen die Qualität ihrer Datenressourcen effektiv messen, überwachen und verbessern.