Beispieleinrichtung für Datengovernance
Microsoft Purview-Datengovernance mit Microsoft Purview Unified Catalog und Microsoft Purview Data Map bietet umfassende Transparenz, Vertrauen in Daten und verantwortungsvolle Innovationen, um Organisationen dabei zu helfen, im Zeitalter der KI einen größeren Geschäftswert zu erzielen. Führen Sie anhand eines Beispiels für die Verwaltung von Integritätsdaten die Schritte in diesem Artikel aus, um zu verstehen, wie Sie Unified Catalog einrichten und deren Funktionalität verwenden, um eine solide Datengovernance für Ihre organization zu erstellen.
Schritt 1: Einrichten Ihrer Governancedomänen in Unified Catalog
Governancedomänen sind der Schlüssel zum Einrichten der Verantwortlichkeit für Ihre Daten und tragen dazu bei, die Governance dieser Daten im gesamten Unternehmen zu verbunden. Wenn Sie Governancedomänen erstellen, stellt der richtige Besitzer sicher, dass Sie in der Lage sind, alle Daten im Datenbestand effektiv zu identifizieren und mit Experten zusammenzuarbeiten. Governancedomänen können viele verschiedene Typen sein, um sich an den Typ der Datenbegrenzung für das Team anzupassen, das diese Daten steuert. Beispiel: Funktionsdomänen (Finanzen, Personalwesen, Vertrieb) oder Datendomänen (Produkt, Kunde, Gesundheit).
Voraussetzungen
- Sie benötigen die Rolle Data Governance-Administrator für die Unified Catalog.
Erteilen von Berechtigungen und Erstellen der ersten Governancedomäne
Öffnen Sie das Microsoft Purview-Portal.
Melden Sie sich beim Microsoft Purview-Portal mit Anmeldeinformationen für ein Administratorkonto an, dem die Rollenverwaltungsrolle zugewiesen ist (z. B. ein Purview-Administrator). Wechseln Sie zu Einstellungen > Rollen und Bereiche , um sie anzuzeigen und zu verwalten.
Wählen Sie Rollengruppen aus.
Wählen Sie auf der Seite Rollengruppen für Microsoft Purview-Lösungen die Rollengruppe Data Governance aus.
Wählen Sie auf der Seite Mitglied der Rollengruppe bearbeiten die Option Benutzer auswählen oder Gruppen auswählen aus.
Aktivieren Sie das Kontrollkästchen für alle Benutzer oder Gruppen, die Sie der Rollengruppe hinzufügen möchten.
Wählen Sie Auswählen aus.
Wählen Sie Unified Catalog die Option Katalogverwaltung und dann Governancedomänen aus.
Auf der Seite Governancedomänen können Sie den Rest Ihres Katalogs einrichten, damit andere personen den Besitz von Daten zusammenführen können, Teams die Möglichkeit haben, ihr Wissen aufzubauen und den geschäftlichen Wert Ihrer Daten zu ermitteln.
- Wählen Sie zunächst Neue Governancedomäne aus.
- Sie können den Namen Ihrer Governancedomäne aktualisieren, aber dafür können wir ihn "(Tutorial) Personal Health" nennen und eine Beschreibung von "Persönliche Gesundheitsdaten beziehen sich auf alle Informationen im Zusammenhang mit der physischen oder geistigen Gesundheit einer Person, die im Gesundheitswesen gesammelt und verwendet werden. Dies kann eine Vielzahl von Datentypen umfassen, z. B. medizinische Aufzeichnungen, Behandlungsverläufe, Diagnosebilder und Labortestergebnisse. Es ist oft durch verschiedene Gesetze und Vorschriften geschützt, um Privatsphäre und Vertraulichkeit zu gewährleisten."
- Wählen Sie den Typ als "Datendomäne" aus.
- Lassen Sie das übergeordnete Element leer (wenn dies die erste Governancedomäne im Katalog ist, kann hier nichts ausgewählt werden).
- Wählen Sie Erstellen aus
- Erstellen Sie nun zwei weitere Domänen selbst. Dies sind wichtige Punkte des Verbunds für Die Zusammenarbeit und Governance in Ihrem eigenen organization. Denken Sie also daran, wer die Besitzer Ihrer Domänen sein könnte, wenn Sie Microsoft Purview Unified Catalog implementieren.
- Sie können diesen Beispielen folgen:
- Eine Unternehmensfunktionsdomäne stellt die stark kontrollierten Ressourcen und Begriffe dar, die ein gesamtes Unternehmen verwendet.
- Der Vertrieb ist eine funktionale Domäne, über die die meisten Organisationen verfügen, bei der es sich um eine untergeordnete Domäne des Unternehmens handelt.
- Wählen Sie zunächst Neue Governancedomäne aus.
Wählen Sie die erstellte Governancedomäne aus.
Wählen Sie die Registerkarte Rollen der Governancedomäne aus.
Wenn Sie die Governancedomäne erstellen, werden Sie standardmäßig allen Rollen in der Governancedomäne hinzugefügt. Als Governancedomänenbesitzer fügen Sie die Data Stewards (Geschäftsexperten in Ihrer Domäne) und die Datenproduktbesitzer (die wissen, welche Datenressourcen für andere am besten zu nutzen sind) hinzu.
Wechseln Sie zurück zur Registerkarte Details .
Wählen Sie die Schaltfläche Richtlinien verwalten aus, um eine Richtlinie auf Domänenebene anzuwenden. Diese Richtlinie wird auf alle Datenprodukte in der Domäne angewendet. Durch die Aktivierung der automatischen Anwendung einer Richtlinie wird sichergestellt, dass die Datenexperten nicht auch Richtlinienexperten sein müssen.
Aktivieren Sie auf der Registerkarte Zugriffsrichtlinien verwalten das Kontrollkästchen neben Datenkopien zulassen. Wenn Sie diese Richtlinienoption auswählen, wird automatisch ein Nachweis angewendet, bei dem alle Benutzer, die Zugriff auf Ihre Datenprodukte anfordern, nachweisen müssen, dass sie die Datenkopierrichtlinie für Ihre Daten verstehen.
Wählen Sie Änderungen speichern aus, um zu bestätigen, dass die Richtlinie von der Governancedomäne festgelegt wird.
Wählen Sie in der Governancedomäne veröffentlichen aus. Über die Schaltfläche Veröffentlichen werden alle anderen Konzepte innerhalb der Domäne veröffentlicht.
Erstellen von Glossarbegriffen
Das Hinzufügen von Glossarbegriffen zu Ihrer Governancedomäne ermöglicht es anderen, besser zu verstehen, wie das Unternehmen die Daten verwendet und versteht. Glossarbegriffe stellen auch sicher, dass Erkenntnisse allgemeine Begriffe und im Allgemeinen Ihr Wissen in Ihrer Governancedomäne verwenden.
Suchen Sie auf der Seite für Ihre Governancedomäne nach den Glossarbegriffen Karte, und wählen Sie Alle anzeigen aus.
Wählen Sie auf der Seite Glossarbegriffedie Option Neuer Begriff aus.
Geben Sie Details ein:
- Name: "Outbreak"
- Beschreibung: Eine Krankheit, die einen großen Teil der Bevölkerung betroffen hat oder hat das Potenzial, einen großen Teil der Bevölkerung zu betreffen.
- Sie können den Rest vorerst leer lassen, aber es gibt Felder, die gesammelt werden müssen: der Begriffsbesitzer, der für die Definition des Begriffs für Ihr Unternehmen verantwortlich ist, Akronyme, um gemeinsame, auch als Namen des Begriffs bezeichnete Namen zu verwenden. Schließlich können Sie Links zu den Ressourcen bereitstellen, die noch mehr Informationen zum Begriff enthalten würden.
Wählen Sie Erstellen aus
Wählen Sie die Schaltfläche Richtlinien verwalten aus. Ähnlich wie bei Richtlinien auf Domänenebene können Sie Richtlinien auf Begriffsebene erstellen, die überall dort angewendet werden, wo der Begriff verwendet wird.
Aktivieren Sie das Kontrollkästchen neben Vorgesetzte Genehmigung erforderlich. Dadurch wird eine sekundäre Genehmigung durch den in Microsoft Entra ID aufgeführten Benutzer-Manager erzwungen, wenn der Zugriff auf die Datenprodukte angefordert wird.
Wählen Sie Veröffentlichen für den erstellten Ausbruchausdruck aus. Veröffentlichte Begriffe können in Unified Catalog gefiltert werden, und stellen Sie sicher, dass andere Benutzer, die den Begriff zum Beschreiben ihres Datenprodukts verwenden, diese Beschreibung beim Durchsuchen des Datenprodukts in Unified Catalog sehen können.
Erstellen Sie nun zwei weitere Begriffe. Wählen Sie dieses Mal den Begriff "Outbreak" als übergeordneten Begriff für die von Ihnen erstellten Begriffe aus. Versuchen Sie, Beziehungen zwischen diesen untergeordneten Begriffen auf der Registerkarte "Verwandte" für einen der beiden Begriffe aufzubauen, um das Netzwerk der Zusammenarbeit dieser Begriffe zu unterstützen, um die Gesamtheit eines Themas zu erklären.
- Pandemie: Ein globaler Ausbruch einer Krankheit, die eine große Anzahl von Menschen in mehreren Ländern oder Kontinenten betrifft.
- Epidemie: Ein landesweiter oder regionaler Ausbruch einer Krankheit, die hoch ansteckend ist und einen großen Teil der Bevölkerung betrifft.
Versuchen Sie, ein paar andere Begriffe in anderen Domänen zu erstellen, die Sie zuvor erstellt haben. Wenn Sie nicht sicher sind, was Sie hinzufügen sollen, probieren Sie die Schaltfläche Get suggested terms (Vorgeschlagene Begriffe abrufen) aus, damit GenAI einige Vorschläge auf der Grundlage der Beschreibung und des Namens der domäne vorschlägt, die Sie bereits angegeben haben.
Hinzufügen eines OKR
Fügen Sie nun ein OKR (Ziel und Schlüsselergebnis) für Ihre Personal Health-Domäne hinzu, damit andere den geschäftlichen Wert Ihrer Daten besser verstehen können. Dadurch wird eine direkte Verbindung zwischen Ihren Daten und dem damit bereitgestellten Geschäftswert hergestellt.
Wählen Sie auf der Seite der Governancedomäne das Feld OKR aus.
Wählen Sie Neues OKR aus.
Geben Sie zuerst die Details des Ziels ein:
- Ziel: Reduzieren Sie das Pandemierisiko, indem Sie eine wirksame Impfstoffaufnahme für Patienten ermöglichen.
- Besitzer: Geben Sie Ihren Namen ein.
- Zieldatum: '31.12.2024'
Wählen Sie Erstellen aus
Das Hinzufügen wichtiger Ergebnisse zu Ihrem Ziel stellt sicher, dass die Ziele messbar sind und dass der Fortschritt in Richtung des Ziels überwacht wird. Wählen Sie + Schlüsselergebnis hinzufügen aus.
Geben Sie die Details des Schlüsselergebnisses ein:
- Hauptergebnis: Stellen Sie sicher, dass 80 % ältere Altersgruppen (>65 Jahre), die am wahrscheinlichsten von der Pandemie betroffen sind, bis zum Ende des Kalenderjahres 2024 eine vollständige Impfung erhalten.
- Fortschritt status: Auf Kurs
- Fortschrittsbetrag: 70
- Zielbetrag: 80
- Maximaler Betrag: 100
Wählen Sie Erstellen aus.
Wählen Sie Veröffentlichen aus.
Erstellen kritischer Datenelemente
Erstellen Sie schließlich ein kritisches Datenelement (CDE) in Personal Health, um sicherzustellen, dass die wichtigsten Datenspalten über eine konsistente Definition und ein einheitliches Verständnis verfügen und immer die Geschäftlichen Erwartungen hinsichtlich der Art und Weise, wie diese Daten gebildet und gespeichert werden, erfüllen.
- Wählen Sie auf der Seite "Governancedomänen" mit ausgewählter Domäne "Personal Health" das Feld Kritische Datenelemente aus.
- Wählen Sie Neues kritisches Datenelement aus.
- Geben Sie die grundlegenden CDE-Metadaten ein:
- Name: Altersgruppen
- Beschreibung: Allgemeine Gruppierung von Personenaltern, die verwendet werden, um sicherzustellen, dass erforderliche analyseberichte einem Verweis folgen, auf den sich andere verlassen können, und entfernen einzelne Altersstufen, um die Anonymität der Daten zu verbessern. Die Altersgruppe ist in 8 Gruppen unterteilt; <2 Jahre, 2-4 Jahre, 5-11 Jahre, 12-17 Jahre, 18-24 Jahre, 25-49 Jahre, 50-64 Jahre, 65+ Jahre.
- Besitzer: Geben Sie Ihren Namen ein.
- Erwarteter Datentyp: Text
- Wählen Sie Erstellen aus
Die eigentliche Leistungsfähigkeit des CDE besteht darin, dass es direkt den physischen Datenspalten zugeordnet wird, in denen diese Daten gespeichert werden. Diese Verbindung stellt ein gemeinsames Verständnis sicher und ermöglicht die Auswertung von Data Quality-Regeln und -Richtlinien im großen Stil.
Wählen Sie in der soeben erstellten CDE + Spalte hinzufügen aus.
Suchen Sie im Goldcontainer des Data Lake nach der Datenressource "Impfstoff und Falltrends für Covid 19 "
Wählen Sie das Kontrollkästchen und nicht den Namen der Ressource Covid-19-Impfstoff und -Falltrends aus.
Tipp
Wenn Sie den blauen Namen des Medienobjekts auswählen, wird ein neues Fenster in Microsoft Purview geöffnet, in dem Die Ressourcendetails angezeigt werden.
Aktivieren Sie das Optionsfeld neben der Spalte AgeGroupVacc.
Klicken Sie auf Hinzufügen.
Wählen Sie oben im CDE, das Sie gerade erstellt haben, die Registerkarte Datenqualität aus, um Datenqualitätsregeln auf die CDE anzuwenden. Dies ähnelt dem Hinzufügen von Richtlinien für Glossarbegriffe und Governancedomänen.
Wählen Sie Neue Regel aus.
Wählen Sie Datentyp match aus.
Regelnamen eingeben: Altersgruppenformatierung bestätigen
Wählen Sie Erstellen aus
Wählen Sie im CDE veröffentlichen aus.
Diese CDE wendet jetzt automatisch eine Datenqualitätsregel auf jedes Datenprodukt an, das die Ressource Covid-19-Impfstoff und -Falltrends verwendet, die wir im nächsten Abschnitt durchlaufen werden.
- Versuchen Sie, einige andere CDEs in Ihren anderen Domänen zu erstellen. Hier sind einige Ideen:
- Umsatz: Umsatz und Verkäufername
- Unternehmen: Produkt-ID
Schritt 2: Einrichten und Registrieren Ihrer Daten in Data Map
Wenn Keine Datenquellen für die Überprüfung verfügbar sind, können Sie die folgenden Schritte ausführen, um ein beispiel für Azure Data Lake Storage (ADLS Gen2) vollständig bereitzustellen.
Tipp
Wenn Sie bereits über eine Datenquelle im selben Mandanten wie Ihr Microsoft Purview-Konto verfügen, fahren Sie mit dem nächsten Teil dieses Abschnitts fort, um Ihre Ressourcen zu überprüfen.
In einer realen Datenumgebung finden Sie viele verschiedene Systeme, die für verschiedene Datenanwendungen verwendet werden. Es gibt Berichtsumgebungen wie Fabric und Snowflake, in denen Teams Kopien von Daten verwenden, um Analyselösungen zu erstellen und ihre Berichte und Dashboards zu unterstützen. Es gibt betriebsbezogene Datensysteme, die die Anwendungsteams oder Kunden verwenden, um Geschäftsprozesse abzuschließen, die Daten basierend auf entscheidungen sammeln oder hinzufügen, die während des Prozesses getroffen wurden.
Um einen realistischeren Datenbestand zu erstellen, wird empfohlen, viele Datenquellen im Katalog anzuzeigen, die die Breite der verschiedenen Datenverwendungen jedes Unternehmens abdecken können. Die Arten von Daten, die für einen Anwendungsfall erforderlich sind, können bei Geschäftsbenutzern, die Berichte und Dashboards benötigen, sehr unterschiedlich sein. Analysten benötigen konforme Dimensionen und Fakten, um Berichte zu erstellen, wissenschaftliche Fachkräfte für Daten oder Technische Fachkräfte für Daten benötigen Rohdaten, die direkt aus dem System stammen, das die Daten alle erfasst, und mehr ermöglichen es verschiedenen Benutzern, die Wichtigkeit der Suche zu erkennen, Verstehen und Zugreifen auf Daten am selben Ort.
Weitere Tutorials zum Hinzufügen von Daten zu Ihrem Bestand finden Sie in den folgenden Anleitungen:
- Fabric Lakehouse-Tutorial : Stellt die Grundlage einer Berichterstellungsumgebung bereit
- Azure SQL-Datenbank (Beispiel) – bietet ein gut strukturiertes Beispiel für einen operativen Datenspeicher.
Voraussetzungen
- Abonnement in Azure: Erstellen Ihres kostenlosen Azure-Kontos noch heute
- Microsoft Entra ID für Ihren Mandanten: Microsoft Entra ID Governance
- Ein Microsoft Purview-Konto
- Admin Zugriff auf das Microsoft Purview-Konto (Dies ist die Standardeinstellung, wenn Sie das Microsoft Purview-Konto erstellt haben. Berechtigungen in der Vorschauversion des neuen Microsoft Purview-Portals | Microsoft Learn)
- Alle Ressourcen; Microsoft Purview, Ihre Datenquelle und Microsoft Entra ID müssen sich im selben Cloudmandanten befinden.
Einrichten Ihres Datenbestands
A. Erstellen und Auffüllen eines Speicherkontos
- Befolgen Sie diese Anleitung zum Erstellen eines Speicherkontos: Erstellen eines Speicherkontos für Azure Data Lake Storage Gen2
- Erstellen Sie Container für Ihren neuen Data Lake:
- Navigieren Sie zur Seite Übersicht unseres Speicherkontos.
- Wählen Sie im Abschnitt Datenspeicher die Registerkarte Container aus.
- Wählen Sie die Schaltfläche + Container aus.
- Benennen Sie "bronze", und wählen Sie die Schaltfläche Erstellen aus.
- Wiederholen Sie diese Schritte, um einen Goldcontainer zu erstellen.
- Laden Sie einige CSV-Beispieldaten aus data.gov herunter: Covid-19-Impf- und Falltrends nach Altersgruppe, USA
- Laden Sie die CSV-Datei in den Container "bronze" im speicherkonto hoch, das Sie erstellt haben.
- Wählen Sie den Container "bronze" und dann die Schaltfläche Hochladen aus.
- Durchsuchen Sie den Speicherort, an dem Sie die CSV-Datei gespeichert haben, und wählen Sie die Datei Covid-19_Vaccination_Case _Trends aus.
- Wählen Sie Hochladen aus.
B. Erstellen einer Azure Data Factory
In diesem Schritt wird veranschaulicht, wie Daten zwischen den Ebenen eines Medallion Data Lake verschoben werden, und es wird sichergestellt, dass die Daten in einem standardisierten Format vorliegen, das von Den Verbrauchern erwartet wird. Dies ist ein Voraussetzungsschritt für die Ausführung von Data Quality.
Befolgen Sie diese Anleitung, um eine Azure Data Factory zu erstellen: Erstellen einer Azure Data Factory
Kopieren Sie die Daten aus der CSV-Datei im Container "bronze" als Tabelle im Delta-Format in den Container "gold". Verwenden Sie dazu diesen Azure Data Factory Leitfaden: Transformieren von Daten mithilfe eines Zuordnungsdatenflusses.
Öffnen Sie die Azure Data Factory (ADF) im Azure-Portal, indem Sie auf der Registerkarte Übersicht der erstellten ADF-Ressource die Schaltfläche Studio starten auswählen.
Wählen Sie in ADF Studio die Registerkarte Autor aus.
Wählen Sie die + Schaltfläche aus, und wählen Sie datenfluss aus dem Dropdownmenü aus.
Nennen Sie den Dataflow "CSVtoDeltaC19VaxTrends".
Wählen Sie im leeren Feld Quelle hinzufügen aus.
Legen Sie Quelleinstellungen auf Folgendes fest:
- Name des Ausgabestreams: "C19csv"
- Beschreibung: Leer lassen
- Quelltyp: Inline
- Inlinedatasettyp: Text mit Trennzeichen
- Verknüpfter Dienst: Wählen Sie den Data Lake aus, in dem Sie die CSV-Datei gespeichert haben.
Legen Sie Quelloptionen auf Folgendes fest:
- Dateimodus: Datei
- Dateipfad: /bronze/ Covid-19_Vaccination_Case _Trends
- Keine Dateien gefunden: Deaktiviert lassen
- Change Data Capture: Deaktiviert lassen
- Komprimierungstyp: Keine
- Codierung: Standard(UTF-8)
- Spaltentrennzeichen: Komma (,)
- Zeilentrennzeichen: Default(\r, \n oder\r\n)
- Anführungszeichen: Doppeltes Anführungszeichen (")
- Escapezeichen: Umgekehrter Schrägstrich ()
- Erste Zeile als Kopfzeile: CHECKED
- Übernehmen Sie den Rest als Standardwerte.
Wählen Sie das kleine + Neben der erstellten Quelle und dann Senke aus.
Erstellen Sie die Senke, in der das Format und der Speicherort der zu speichernden Daten gespeichert werden sollen, um die Daten aus einer CSV-Datei in "Bronze" in eine Deltatabelle in "Gold" zu verschieben.
- Festlegen der Senkewerte (übernehmen Sie alle Einstellungen als Standard, sofern nicht angegeben).
- Senkentyp: Inline
- Inlinedatasettyp: Delta
- Verknüpfter Dienst: Derselbe Data Lake wie in der Quelle, da wir in einem anderen Container speichern.
Legen Sie die Einstellungswerte fest (übernehmen Sie alle Einstellungen als Standard, sofern nicht angegeben).
- Ordnerpfad: Gold/Covid19-Impfstoff und Falltrends
Sie müssen den Wert eingeben, da dieser Name die Daten speichern soll und nicht vorhanden ist.
Wählen Sie Überprüfen aus, um Den Datenfluss zu überprüfen und Anweisungen zum Beheben von Fehlern bereitzustellen.
Wählen Sie Alle veröffentlichen aus.
Wählen Sie die + Schaltfläche aus, und wählen Sie im Dropdownmenü pipeline aus.
Nennen Sie Ihre Pipeline "CSV to Delta C19 Vax Trends"
Wählen Sie den in den vorherigen Schritten erstellten Dataflow csv to Delta (C19VaxTrends) aus, und ziehen Sie ihn auf der geöffneten Pipelineregisterkarte.
Wählen Sie Überprüfen aus.
Wählen Sie Veröffentlichen aus.
Wählen Sie Debuggen (Aktivitätslaufzeit verwenden) aus, um die Pipeline auszuführen.
Tipp
Wenn Fehler für Leerzeichen oder ungeeignete Zeichen für das Deltaformat auftreten: Öffnen Sie die heruntergeladene CSV-Datei, und nehmen Sie Korrekturen vor. Laden Sie dann die CSV-Datei erneut hoch, und überschreiben Sie sie in der Bronzezone. Führen Sie dann Ihre Pipeline erneut aus.
Navigieren Sie im Data Lake zu Ihrem Goldcontainer. Nun sollte die neue Delta-Tabelle angezeigt werden, die während der Pipeline erstellt wurde.
Überprüfen Ihrer Ressourcen
Wenn Sie keine Datenressourcen in Ihrem Microsoft Purview Data Map gescannt haben, können Sie die folgenden Schritte ausführen, um Ihre Datenzuordnung aufzufüllen.
Beim Überprüfen von Quellen in Ihrem Datenbestand werden automatisch die Metadaten der Datenassets (Tabellen, Dateien, Ordner, Berichte usw.) in diesen Quellen erfasst. Indem Sie eine Datenquelle registrieren und die Überprüfung erstellen, legen Sie den technischen Besitz an den Quellen und Ressourcen fest, die im Katalog angezeigt werden, und stellen sicher, dass Sie die Kontrolle darüber haben, wer auf welche Metadaten in Microsoft Purview zugreifen kann. Durch die Registrierung und Speicherung von Quellen und Ressourcen auf Domänenebene werden sie auf der höchsten Ebene der Zugriffshierarchie gespeichert. In der Regel ist es am besten, einige Sammlungen zu erstellen, in denen Sie die Ressourcenmetadaten scannen und die richtige Zugriffshierarchie für diese Daten einrichten.
-
Bieten Sie Leserzugriff für Microsoft Purview Managed Identity (MSI) auf Ihren Data Lake oder einen anderen Datenspeicher.
Tipp
Die MSI ist der Kontoname des Microsoft Purview-instance.
Wenn Sie sich für die Verwendung von Microsoft Fabric oder SQL entschieden haben, können Sie die folgenden Leitfäden verwenden, um Zugriff zu gewähren:
Registrieren Ihres Data Lake und Überprüfen Ihrer Ressourcen
Wählen Sie Microsoft Purview Data Map auf der Registerkarte Domänen die Rollenzuweisungen für die Domäne aus (der Name des Microsoft Purview-Kontos):
- Fügen Sie sich selbst als Datenquellenadministrator und Datenkurator zur Domäne hinzu.
- Wählen Sie das Personensymbol neben der Rolle Datenquellenadministrator aus.
- Suchen Sie Ihren Namen so, wie er in Microsoft Entra ID ist (möglicherweise müssen Sie Ihren vollständigen Namen genau so eingeben, wie er in Microsoft Entra ID ist).
- Wählen Sie OK aus.
- Wiederholen Sie diese Schritte für den Datenkurator.
- Fügen Sie sich selbst als Datenquellenadministrator und Datenkurator zur Domäne hinzu.
Registrieren des Data Lake:
- Wählen Sie die Registerkarte Datenquellen aus.
- Wählen Sie Registrieren aus.
- Wählen Sie den speichertyp Azure Data Lake Storage Gen2 aus.
Geben Sie die Details zum Herstellen einer Verbindung an:
- Abonnement (optional)
- Datenquellenname (dies ist der Name der ADLS Gen2-Quelle)
- Sammlung, in der Ressourcenmetadaten gespeichert werden sollen (optional)
- Wählen Sie Registrieren aus.
Sobald die Registrierung der Datenquelle abgeschlossen ist, können Sie die Überprüfung konfigurieren. Die Registrierung bedeutet, dass Microsoft Purview mit der Datenquelle verbunden ist und sie in der richtigen Sammlung für den Besitz abgelegt hat. Die Überprüfung liest dann die Metadaten aus der Quelle und füllt die Ressourcen in der Datenzuordnung auf.
Wählen Sie die Quelle aus, die Sie auf der Registerkarte "Datenquellen" registriert haben.
Wählen Sie neue Überprüfung aus, und geben Sie Details an:
- Verwenden der Standardmäßigen Integration Runtime für diese Überprüfung
- Anmeldeinformationen sollten Microsoft Purview MSI (System) sein.
- Scanebene ist "Auto Detect"
- Wählen Sie eine Sammlung aus, oder verwenden Sie die Domäne (Sammlung muss dieselbe Sammlung oder untergeordnete Sammlung sein, in der die Datenquelle registriert wurde)
- Wählen Sie Weiter aus.
Tipp
An diesem Punkt testt Microsoft Purview die Verbindung, um zu überprüfen, ob eine Überprüfung durchgeführt werden kann. Wenn Sie dem Microsoft Purview MSI-Leser keinen Zugriff auf die Datenquelle gewährt haben, tritt ein Fehler auf. Wenn Sie nicht der Besitzer der Datenquelle sind oder über Benutzerzugriff Mitwirkender tritt bei der Überprüfung ein Fehler auf, da erwartet wird, dass Sie über die Berechtigung zum Erstellen der Verbindung verfügen.
Wählen Sie jetzt nur den Container "gold" aus, in dem die Delta-Tabelle im Abschnitt "Gebäudedaten" des Tutorials platziert wurde. Dadurch wird verhindert, dass andere Datenassets in Ihrem Datenspeicher überprüft werden.
- Sollte nur ein blauer Häkchen neben Gold vorhanden sein, können Sie Prüfungen neben allem belassen, da die vollständige Quelle überprüft und trotzdem die Ressourcen erstellt werden, die wir verwenden und mehr.
- Wählen Sie Weiter aus.
Auf dem Bildschirm "Scanregelsatz auswählen" sollten Sie den Standardregelsatz für die Überprüfung verwenden.
Wählen Sie Weiter aus.
In Set a scan trigger (Überprüfungstrigger festlegen) legen Sie die Häufigkeit der Überprüfung so fest, dass die Datenzuordnung weiterhin aufgefüllt wird, wenn Sie dem Goldcontainer des Lake datenassets hinzufügen. Wählen Sie Einmal aus.
Wählen Sie Weiter.
Wählen Sie Speichern und ausführen aus. Dadurch wird eine Überprüfung erstellt, die nur die Metadaten aus dem Goldcontainer Ihres Data Lake liest und die Tabelle auffüllt, die wir in Microsoft Purview Unified Catalog in den nächsten Abschnitten verwenden. Wenn Sie nur Speichern auswählen, wird die Überprüfung nicht ausgeführt, und die Ressourcen werden nicht angezeigt. Sobald die Überprüfung ausgeführt wird, wird die von Ihnen erstellte Überprüfung mit dem status Letzte Ausführung in der Warteschlange angezeigt. Wenn die Überprüfungslesevorgänge abgeschlossen sind, sind Ihre Ressourcen für den nächsten Abschnitt bereit. Dies kann einige Minuten oder Stunden dauern, je nachdem, wie viele Ressourcen Sie in Ihrer Quelle haben.
Schritt 3: Veröffentlichen Ihrer Datenprodukte
Das Erstellen von Datenprodukten ist unerlässlich, um sicherzustellen, dass die richtigen Daten von Ihren organization auffindbar gemacht werden. Datenprodukte tragen dazu bei, eine übermäßige Steuerung von Daten zu verhindern, die einen geringen oder keinen Wert in Ihrem Datenbestand haben, da sie keine Verwendung oder einen begrenzten Wert haben. Wenn Sie sicherstellen, dass Ihre Datenexperten datenprodukte veröffentlichen, werden Ihre wertvollsten Daten aktiviert und basierend auf diesem Wert die richtige Governanceebene erstellt. Das Zusammenstellen von Ressourcen, die technischen Teams den Geschäftszweck nicht kennen oder versuchen, alles in Ihrem komplexen und wachsenden Datenbestand zu steuern, führt zu zusätzlicher Zeit und produktivitätsverlustend, da die Details der Daten, die möglicherweise nie verwendet werden oder einfach aus dem Bestand entfernt werden könnten, abgeschatten werden. Konzentrieren Sie sich stattdessen auf die Datenelemente, die einen Wert haben und die Menschen noch mehr Wert entwickeln müssen. Da Teams mehr Daten verwenden und ein besseres Verständnis dafür erhalten, was benötigt wird, oder nützlichere Datenprodukte erstellt werden können, um diese Anforderungen zu erfüllen, und Governance kann angepasst werden, um sicherzustellen, dass sie immer die richtige Größe basierend auf dem Wert und der Vertraulichkeit der Daten behält.
Voraussetzungen
- Muss ein Datenproduktbesitzer für die von Ihnen verwendete Governancedomäne sein.
- Datenassets müssen in der Data Map enthalten sein. Wenn dies nicht der Fall ist, lesen Sie Abschnitt 2 dieses Tutorials , um einige hinzuzufügen.
- Eine Governancedomäne muss veröffentlicht werden, um ein Datenprodukt zu veröffentlichen. Wenn Sie noch keines haben, lesen Sie Abschnitt 1 dieses Tutorials, um eins zu erstellen.
Erstellen und Veröffentlichen eines Datenprodukts
Öffnen Sie das Microsoft Purview-Portal.
Wählen Sie Unified Catalog aus.
Wählen Sie Katalogverwaltung und dann Governancedomänen aus.
Wählen Sie auf der Seite Governancedomänen die Domäne Personal Health aus.
Wählen Sie unter Geschäftskonzepte den Link Zu Datenprodukten wechseln aus.
Hier identifizieren die Datenexperten, die als Datenproduktbesitzer bezeichnet werden, die Datenressourcen, die von anderen Personen in Ihrem organization genutzt werden sollen, und stellen die erforderlichen Informationen bereit, um sie nutzbar zu machen.
Wählen Sie Neues Datenprodukt aus.
Geben Sie Details zum Datenprodukt an.
- Name: "Covid-19-Impfung und Falltrend nach Alter"
- Beschreibung: "Diese Daten stammen vom CDC als Teil des US-Gesundheitsministeriums & Human Services. Die Daten enthalten Trends bei Impfungen und Fällen nach Altersgruppen auf nationaler Ebene der USA. Die Daten werden um mindestens eine Dosis geschichtet und vollständig geimpft. Data repräsentiert auch alle Impfpartner, einschließlich zuständiger Partnerkliniken, Einzelhandelsapotheken, Langzeitpflegeeinrichtungen, Dialysezentren, Federal Emergency Management Agency und Health Resources and Services Administration Partnerstandorte sowie Einrichtungen von Bundeseinrichtungen."
- Typ: Dataset
- Wählen Sie Weiter aus.
- Anwendungsfälle: "Diese Daten dienen der öffentlichen Nutzung und sollen helfen, die Trends der Impfung und der neuen Fälle in verschiedenen Altersgruppen zu verstehen. Die Altersstufen sind in zwei Gruppen von <2 Jahren bis 65+ Jahren unterteilt. Ebenso werden die Trends in täglichen Zahlen angegeben, die den Sieben-Tage-Durchschnitt der neuen Fälle nach Altersgruppen liefern."
- Markieren Sie als Unterstützt als aktiviert.
- Klicken Sie auf Speichern.
Nun haben Sie die Basismetadaten des Datenprodukts erstellt. Fügen Sie als Nächstes einige Eigenschaften hinzu, und ordnen Sie das Objekt aus der Data Map zu.
Wählen Sie die Schaltfläche + Datenressourcen hinzufügen aus.
Sie sehen die Ressourcen, die Sie in der Data Map gescannt haben. Dies umfasst alle Ordner und Ebenen der Datenquelle.
Suchen Sie nach der Ressource Covid19-Impfstoff und -Falltrends , die Sie dem Goldcontainer Ihres Data Lake hinzugefügt haben, und wählen Sie diesen Ressourcensatz aus.
Klicken Sie auf Hinzufügen. Sie können so viele Ressourcen auswählen, wie für ein Datenprodukt erforderlich ist, aber hier wird nur eine benötigt.
Tipp
Probieren Sie die Schaltfläche Vorschläge abrufen aus, um GenAI bei der Auswahl aus den Ressourcen in Ihrer Data Map und wählen Sie die Covid19-Impfstoff- und Falltrends aus einer reduzierten Ergebnisliste aus.
Sie können nun sehen, dass die Ressource Zu Ihrem Datenprodukt hinzugefügt wurde.
Wählen Sie + Ausdruck hinzufügen neben dem Titel des Glossarbegriffs aus.
Wählen Sie den zuvor erstellten Ausbruchsausdruck aus, und wählen Sie Hinzufügen aus.
Das kritische Datenelement für die Altersgruppe sollte jetzt aus der Ressource angezeigt werden, die dem Datenprodukt zugeordnet ist.
Wählen Sie + OKR hinzufügen neben dem OKR-Titel aus.
Wählen Sie das Pandemierisiko reduzieren aus, indem Sie eine wirksame Impfstoffaufnahme für Patienten ermöglichen. Dies ist das Ziel, das wir im ersten Abschnitt erstellt haben.
Verwalten von Zugriffsanforderungsrichtlinien für Datenprodukte
Oben auf der Seite ist der letzte Schritt vor der Veröffentlichung des Datenprodukts das Auswählen der Schaltfläche Richtlinien verwalten . Hier werden die Zugriffsrichtlinien und der Anforderungszugriffsworkflow konfiguriert, indem Eine Auswahl getroffen und die Namen zur Genehmigung bereitgestellt werden. Sie können auch die Registerkarte Geerbte Richtlinien verwenden, um die Governancedomänenrichtlinie anzuzeigen, die auf den Zuvor angewendeten Nachweis von Datenkopien angewendet wurde. Dies gilt auch für die erforderliche Manager-Genehmigung , die aus dem Begriff "Outbreak Glossar" stammt.
Wählen Sie die Registerkarte Richtlinien verwalten aus.
Geben Sie unter Zugriffszeitlimit Details dazu an, wie lange die Zugriffsanforderung gut ist, bevor sie verlängert werden muss. Wir legen dies so fest, dass der Zugriff für bis zu einem Jahr gewährt wird.
Geben Sie 1 in das Feld ein.
Wählen Sie in der Dropdownliste Jahre aus.
Geben Sie unter Genehmigungsanforderungen Ihren Namen im Feld genehmigende Personen an. (Hierfür ist der in Microsoft Entra ID registrierte Name erforderlich.)
Hinweis
Es ist nicht erforderlich, die Genehmigung des Managers zu überprüfen, da diese Richtlinie vom Begriff des Ausbruchsglossars geerbt wird.
Wählen Sie die Schaltfläche Vorschau des Anforderungsformulars aus, um zu sehen, was die Katalogconsumer beim Anfordern des Zugriffs anzeigen. Sie sehen den Nachweis des Datenkopiervorgangs und die Genehmigung des Managers, da sie von der Governancedomäne und dem Glossarbegriff festgelegt wurden.
Wählen Sie Änderungen speichern aus.
Nachdem Sie die Datenressourcen zugeordnet und die Zugriffsrichtlinien konfiguriert haben, können Sie Ihr Datenprodukt im Katalog veröffentlichen.
Wählen Sie veröffentlichen für das Datenprodukt aus.
Versuchen Sie, einen Gewinnbericht in anderen Domänen zu erstellen, die Sie zuvor erstellt haben.
- Gewinnbericht, Typ: Dashboards/Berichte.
- Product Master, Type: Maser-Daten und Verweisdaten.
Hinweis
Sie können ihnen viele Ressourcen hinzufügen und sehen, wie ein Datenprodukt mit vielen Ressourcen aussieht, und die Datenprodukte den Begriffen aus einer beliebigen Domäne zuordnen, um zu sehen, wie das Glossar verwendet wird, um die Daten mit einem konsistenten Satz von Begriffen zu beschreiben.
Schritt 4: Ausführen der Datenqualität
Nachdem Sie nun über ein Datenprodukt im Katalog verfügen, wird das Ausführen von Data Quality-Regeln jedem mitteilen, dass die Daten in gutem Zustand sind und zur Verwendung bereit sind. Wenn mehr über die Daten erfahren wird, können neue Data Quality-Regeln hinzugefügt werden, um sicherzustellen, dass sie für alle Anwendungsfälle geeignet sind. Wenn Sie sicherstellen, dass Datenprodukte von höchster Qualität sind, können Sie Vertrauen in Ihre Daten schaffen und anderen mitteilen, dass sie besser überwacht werden. Wenn der Wert der Daten steigt, muss die Qualität dieser Daten genauer überwacht und kontrolliert werden, da Probleme mit der Datenqualität bei schlechter Verwaltung massive Auswirkungen haben können.
Voraussetzungen
- Data Quality-Regeln können nur für Deltaformattabellen in ADLS Gen2 und Microsoft Fabric ausgeführt werden.
- Die verwaltete Identität von Microsoft Purview muss aktiviert sein, um die Datenquelle zu lesen, da sie derzeit die einzigen unterstützten Anmeldeinformationen für die Datenqualität ist.
- Sie müssen über die Rolle Data Quality Steward in der Governancedomäne verfügen, in der Sie die Datenqualität ausführen.
- Sie müssen der Besitzer sein oder über Benutzerzugriffsadministratoren auf die Datenquelle verfügen, die Sie mit der Überprüfung der Datenqualität verbinden, um eine ordnungsgemäße Sicherheitsautorisierung zum Überprüfen der Daten sicherzustellen.
- Sie müssen über die Rolle Data Profile Steward verfügen, um Profile für Ihre Daten ausführen zu können.
Erstellen und Ausführen von Datenqualitätsregeln
Öffnen Sie das Microsoft Purview-Portal.
Wählen Sie Unified Catalog aus.
Wählen Sie unter Datenverwaltung die Registerkarte Datenqualität aus.
Wählen Sie die in Abschnitt 1 erstellte Persönliche Integritätsdomäne aus.
Wählen Sie die Schaltfläche Verwalten aus, und wählen Sie im Menü Connections aus. Durch das Herstellen dieser Verbindung wird sichergestellt, dass Sie In der Lage sind, Datenqualitätsscans für Ihre Datenquelle in dieser Governancedomäne durchzuführen, sodass Teams ohne ordnungsgemäße Autorisierung keinen Zugriff auf Die Daten erhalten.
Wählen Sie auf dem Bildschirm "Verbindungen" die Option Neu aus, um eine neue Verbindung zu erstellen:
- Geben Sie den Anzeigenamen "Personal Health ADLSg2 DQ" an.
- Wählen Sie den Quelltyp der Azure Data Lake Storage Gen2 aus.
- Geben Sie Details zur Datenquelle an, die in Abschnitt 2 erstellt wurde.
Hinweis
Anmeldeinformationen müssen Microsoft Purview MSI (System) für eine Datenqualitätsverbindung sein.
- Wählen Sie Verbindung testen aus.
- Nachdem die Verbindung getestet wurde, wählen Sie Senden aus.
- Geben Sie Details zur Datenquelle an, die in Abschnitt 2 erstellt wurde.
Sobald die Verbindung hergestellt wurde, können Sie Profile ausführen und mit dem Erstellen von Datenqualitätsregeln beginnen. Dadurch wird sichergestellt, dass die Experten, die die Geschäftsregeln und die entsprechenden Regeln kennen, auf den wichtigsten Datenprodukten ausgeführt werden.
- Zurück zur Seite Datenqualität.
- Wählen Sie die Governancedomäne Personal Health aus.
- Wählen Sie das Produkt Covid-19-Impfung und Falltrend nach Alter aus, das in Abschnitt 3 erstellt wurde.
- Wählen Sie das Medienobjekt aus, das dem Datenprodukt hinzugefügt wurde. (Es muss im Deltaformat aus Abschnitt 2 vorliegen, sonst wird die Datenqualität nicht ausgeführt.)
- Wenden Sie Datenqualitätsregeln auf die Spalten der Daten an, um zu messen, ob sie Ihre Qualitätserwartungen erfüllen:
- Wählen Sie auf der ausgewählten Ressource die Registerkarte Regeln aus.
- Wählen Sie Neue Regel aus.
- Wählen Sie Die Regel leere/leere Felder aus.
- Geben Sie Details an:
- Wählen Sie die Spalte AgeGroupVacc aus der Dropdownliste der Spalte aus.
- Regelname: Bestätigen, dass die Impfaltersgruppe vorhanden ist
- Wählen Sie Erstellen aus.
- Wählen Sie Neue Regel aus.
- Wählen Sie Datentyp match aus.
- Geben Sie Details an.
- Wählen Sie DatumSpalte hinzufügen aus.
- Wählen Sie Erstellen aus.
- Wählen Sie Run Data quality scan (Datenqualitätsüberprüfung ausführen) aus.
Profildaten
Erstellen Sie ein Profil für Ihre Daten, um die allgemeinen Statischen jeder Spalte anzuzeigen und Anomalien zu ermitteln, die eine neue Regel aufweisen könnten.
- Wählen Sie in Unified Catalog Die Option Integritätsverwaltung und dann Datenqualität aus.
- Auswählen von Profildaten
- Aktivieren Sie das obere Kontrollkästchen neben Spaltenname , um ein Profil für alle Spalten zu erstellen. Microsoft Purview empfiehlt, welche Spalten ein Profil erstellen sollen, und Sie können Spalten auswählen, von denen Sie wissen, dass sie eine Profilerstellung wert sind, um zu verhindern, dass Profile mit hochsensiblen Daten oder Daten, von denen Sie wissen, dass sie nur spärlich aufgefüllt werden.
- Auswählen des Ausführungsprofils
Wenn die Überprüfung abgeschlossen ist, können Sie die Datenqualitätsbewertung und das Profil für Ihr neues Datenprodukt überprüfen, und die Datenqualitätsbewertung steht allen Benutzern des Katalogs zur Verfügung, um sicherzustellen, dass alle die status der Daten kennen.
Erstellen Sie einen Zeitplan für Ihre Datenqualitätsüberprüfungen, um sicherzustellen, dass Sie kontinuierlich Auf Probleme mit der Datenqualität überwachen. Legen Sie Warnungen fest, um sicherzustellen, dass Probleme mit der Datenqualität behoben werden, bevor Consumer betroffen sind.
- Wählen Sie unter Integritätsverwaltungdie Option Datenqualität aus.
- Wählen Sie die Domäne Personal Health aus, in der die Datenqualitätsregeln konfiguriert wurden.
- Wählen Sie in der Dropdownliste Verwalten die Option Geplante Überprüfungen aus.
- Wählen Sie auf der Seite Geplante Überprüfungen die Option Neu aus.
-
Hinzufügen von Übersichtsdetails
- Name: Personal Health DQ Monatliche Auswertung
- Beschreibung: Monatliche Überprüfung von DQ-Regeln zur kontinuierlichen Verbesserung.
- Wählen Sie Weiter aus.
- Wählen Sie den Bereich der Überprüfung aus.
- Aktivieren Sie das Kontrollkästchen neben Covid-19-Impfung und Falltrend nach Alter Daten produkt
- Wählen Sie Weiter aus.
- Planen Sie die Überprüfung, um sicherzustellen, dass sie am letzten Tag jedes Monats ausgeführt wird.
- Wählen Sie "Serie" aus.
- Wiederholung: Alle einen Monat
- Monatstage: Letzte
- Zeitplan scan time (UTC): 12:00:00
- Wiederholung um (UTC) starten: Übernehmen Sie die Standardeinstellung.
- Wählen Sie Weiter aus.
- Überprüfen Sie die Details der Überprüfung, um festzustellen, ob vor dem Speichern Änderungen vorgenommen werden sollen.
- Klicken Sie auf Speichern. Da wir zuvor eine manuelle Überprüfung ausgelöst haben, müssen wir jetzt keine weitere Überprüfung auslösen, aber wenn eine neue Überprüfung erforderlich ist, wählen Sie Speichern und ausführen aus.
Konfigurieren von Benachrichtigungen
Sobald für die Datenqualität geplante Überprüfungen ausgeführt wurden, können Warnungen ausgelöst werden, um die Stewards darüber zu informieren, ob Probleme oder Aufmerksamkeit aufgrund von Problemen mit der Datenqualität oder Überprüfungsfehlern erforderlich sind. Konfigurieren Sie eine Datenqualitätswarnung für fehlgeschlagene Überprüfungen und wenn die Bewertung um mehr als 5 % abnimmt.
- Zurück auf der Seite Datenqualität zur Domäne "Personal Health".
- Wählen Sie in der Dropdownliste Verwalten die Option Warnungen aus.
- Wählen Sie Neu aus.
- Eingeben von Warnungsdetails
- Anzeigename: Personal Health DQ Monatlicher Scan
- Beschreibung: Um sicherzustellen, dass mindeste DQ-Schwellenwerte die Erwartungen der Kunden erfüllen.
- Ziel: Die Bewertung sinkt um mehr als
- Schwellenwert: 5
- Benachrichtigungen deaktivieren: Deaktiviert lassen
- Benachrichtigung bei fehlerhaften Qualitätsüberprüfungen aktivieren: Aktiviert lassen
- Empfänger: Geben Sie Ihren Namen ein.
- Wählen Sie Weiter.
Tipp
Bei der Implementierung in Ihrem Unified Catalog sollten Sie die Warnungen an die Stewards senden, die Die Verbraucher über das Problem benachrichtigen und mit dem technischen Besitzer der Daten zusammenarbeiten können, um Korrekturen vorzunehmen.
Am Ende dieses Abschnitts verfügen Sie nun über eine funktionierende Unified Catalog mit operativer Datenqualität, um die Daten zu verwalten, die Sie den Datenconsumern der Organisation anbieten. Alles war, um die wertvollsten Daten für den Consumer zu erhalten und Vertrauen in die Daten aufzubauen, die er verwenden würde. Wenn der Wert der Daten wächst und neue Datenstrategien entstehen, wird der nächste Abschnitt helfen, zu zeigen, wie Sie den gesamten Katalog verwalten oder tiefer in die spezifische Datenverwaltung mit Master Data gehen können.
Schritt 5: Masterdatenverwaltung
Masterdatenverwaltung ist die Praxis, die wichtigsten Datenentitäten zu erfüllen, die genau, eindeutig und konsistent in allen Bereichen des Unternehmens angewendet werden müssen, da Fehler und Probleme in diesen Daten das gesamte Unternehmen beeinträchtigen können. Über einen unserer MDM-Partner können Sie Die Master Datenverwaltung-Lösung (MDM) Ihrer Wahl in Microsoft Purview integrieren, um die Datenvereinheitlichung, Standardisierung und Bereinigung zu ermöglichen, die die Erstellung von Golden Record und die Veröffentlichung von master Daten als Datenprodukte ermöglicht.
Befolgen Sie die Tutorials hier für die Lösung Ihrer Wahl: Masterdatenverwaltung in Microsoft Purview
Schritt 6: Verwalten der Datenintegrität
In Microsoft Purview Data Estate Health können das Central Data Office und andere Datenmanager die status der Daten anhand ihrer Unternehmensstandards auswerten und den Fortschritt in Richtung ihrer Strategie effektiv verwalten. Um sicherzustellen, dass jeder im Unternehmen weiß, was getan werden kann, um den Wert seiner Daten zu steigern, ist es wichtig, dass die Standards für die gesamte organization verstanden und skalierbar sind, ohne dass jeder zu einem Data Governance-Experten werden muss. Ausgehend von einem Branchenstandardsatz von Steuerelementen, die in Microsoft Purview in jedem Data Office sofort verfügbar sind, passen Sie die Steuerelemente an ihre Erwartungen an und stellen Sicher, dass sie ihren Datenzielen entsprechen. Entscheidend für die Wirksamkeit dieser Kontrollen ist nicht nur die Messung dieser Standards, sondern auch die Sicherstellung, dass die für die Daten verantwortlichen Personen in der Lage sind, selbst Maßnahmen zu ergreifen und für die Verbesserungen verantwortlich zu machen, die sich auf den Wert der Daten auswirken. In Data Estate Health können Sie all diese wichtigen Funktionen festlegen und verwalten.
Voraussetzungen
- Datenprodukte, Glossarbegriffe und andere Geschäftskonzepte, die in Microsoft Purview Unified Catalog veröffentlicht wurden. Sie können den vorherigen Abschnitten folgen, um diese zu erstellen:
- Mindestens 24 Stunden seit der Zusammenstellung von Datenprodukten.
- Sie müssen in Unified Catalog über die Rolle Datenintegritätsbesitzer verfügen.
Evaluieren Ihrer Datengovernance mit Integrität des Datenbestands
Öffnen Sie das Microsoft Purview-Portal.
Wählen Sie Unified Catalog aus.
Wählen Sie im linken Navigationsbereich unter Data Estate Health die Option Integritätssteuerelemente aus.
Wählen Sie die Karotte > neben der Steuerelementgruppe Wertschöpfung aus.
Wenn Sie mit dem Mauszeiger auf einen Steuerelementtitel zeigen, wählen Sie das Stiftsymbol aus, um das Steuerelement zu bearbeiten. Durch Bearbeiten des Steuerelements ändern Sie den Schwellenwert des Steuerelements, um die Erwartungen für die Bewertung festzulegen, und legen die Farbbewertung fest, um die Fortschrittsstufen zu veranschaulichen.
Die Details ermöglichen es Ihnen, eine Beschreibung des Steuerelements und dessen Bedeutung für Ihre organization bereitzustellen und einen Besitzer für ein bestimmtes Steuerelement festzulegen.
Wählen Sie die Registerkarte Regeln des Steuerelements aus, um den Schwellenwert zu ändern. Dies zeigt, dass es ein hohes Ziel hat, und wenn es nicht fehlerfrei ist, ist es wichtig, nachzuverfolgen.
- Von Gruppe erben: Umschalten, um auszuschalten (sollte grau werden).
- Zielbewertung: 90
- Wählen Sie Neue Regel aus.
- Legen Sie das Feld neben der Bewertung auf GreaterThanOrEqual fest.
- Legen Sie den Prozentsatz auf 90 fest.
- Status = Integrität (grün)
- Else Box Status = Critical (Purple)
- Klicken Sie auf Speichern.
Wählen Sie unter Integrität des Datenbestands die Option Metadatenqualität aus.
Hier können Sie Regeln ändern oder hinzufügen, die die Bewertungen des Steuerelements erstellen. Hier möchten wir den Schweregrad der Aktionen für die Wertschöpfung ändern, um sicherzustellen, dass alle Benutzer die Wichtigkeit dieser Aktion kennen.
- Wählen Sie Schweregrad konfigurieren aus.
- Auswählen der Steuerelementgruppe "Wertschöpfung "
- Wählen Sie den Titel des Ausrichtungssteuerelements "Business OKRs " aus.
- Ändern Sie den Schweregrad von Mittel in Hoch, und wählen Sie Speichern aus.
- Wählen Sie die Registerkarte Integritätsaktionen aus.
- Filter Assigned to: to: to your name (Filter Assigned to: to your name)
- Wählen Sie eine Aktion aus, bei der Sie sehen können, was der Besitzer der Aktion tun muss, um sicherzustellen, dass die Governanceerwartungen erfüllt werden, oder er kann einen neuen Besitzer zuweisen, um den besten Experten für seine Eingabe zu erhalten. Es gibt auch eine status, mit der andere wissen, welche Arbeit ausgeführt wird und wo andere Aktionen priorisiert werden müssen.
Schritt 7: Demokratisierung von Daten
Es Benutzern zu ermöglichen, die benötigten Daten in einer Beschwerde zu finden und darauf zuzugreifen, ist der Kern der Datendemokratisierung und stellt sicher, dass Die Benutzer die Daten finden können, die sie benötigen, um einen geschäftlichen Nutzen zu schaffen. Die Bereitstellung einer sauber und einfachen Erfahrung zum Auffinden von Daten ist der Zweck der Microsoft Purview Unified Catalog und gleichzeitig die Stewards in die Lage zu versetzen, die im Katalog verfügbaren Daten im großen Stil zu aktualisieren und zu verwalten. In diesem Abschnitt erfahren Sie, wie Benutzer Daten finden und den Zugriff darauf anfordern können, und stellen Sie sicher, dass die entsprechenden genehmigenden Personen in der Lage sind, diese Zugriffsanforderungen nachzuverfolgen und Eingaben dafür bereitzustellen.
Voraussetzungen
- Die Schritte 1 bis 4 wurden mindestens abgeschlossen:
- Unified Catalog Leseberechtigung in einer Governancedomäne
Entdecken von Datenprodukten
- Wählen Sie Unified Catalog die Option Ermittlung und dann Datenprodukte aus.
- Verwenden Sie auf der Seite Datenprodukte die Suchleiste, um nach Impfraten nach Alter zu suchen.
- Hier sehen Sie die Datenprodukte, die Sie in Abschnitt 2 veröffentlicht haben. Dies zeigt, wie Benutzer nur für die Daten verfügbar gemacht werden, die für die Ermittlung vorgesehen sind, und verhindert, dass Benutzer in einem hochtechnischen Datenbestand navigieren müssen.
- Wählen Sie das Produkt Covid-19-Impfung und Falltrend nach Alter aus.
- Hier können Consumer die von Ihnen bereitgestellten Metadaten und alle anderen Eigenschaften sehen, die während des Setups konfiguriert wurden. Die Datenqualitätsbewertung ist ebenfalls vorhanden, damit Die Verbraucher die Qualität kennen, bevor sie überhaupt Zugriff auf die Daten erhalten.
- Wählen Sie das Medienobjekt aus, und der Consumer kann sehen, dass alle Spalten unter in der Datenressource verfügbar sind.
- Wählen Sie den Begriff Outbreak Glossar aus, und der Verbraucher kann die Beschreibung und andere Informationen zum Begriff sehen, um ein tieferes Verständnis der Daten zu erhalten.
- Sobald der Consumer sicher ist, dass er diese Daten verwenden möchte, muss er genehmigten Zugriff auf die Daten erhalten.
- Wählen Sie Zugriff anfordern aus.
- Füllen Sie die Formulardetails aus, um eine Anfrage zu senden.
- Benutzer: Geben Sie Ihren Namen an.
- Vorgesetzte Genehmigung: Automatisch erforderlich und an den Microsoft Entra ID Manager weitergeleitet.
- Zweck: Auswählen eines Zwecks
- Geschäftliche Begründung: OKR-Überwachung
- Aktivieren Sie das Kontrollkästchen neben dem Nachweis, um anzugeben, dass Sie die Erwartungen zur Verwendung dieser Daten verstehen.
- Wählen Sie Senden aus.
Die Zugriffsanforderung wird nun an die aufgelistete verwaltete Microsoft Entra ID gesendet. Von hier aus kann der Manager auf die Anforderungen zugreifen, indem er die E-Mail öffnet und einen Link auswählt oder zu Microsoft Purview gelangt. Das Genehmigen und Verwalten des Zugriffs kann direkt in Microsoft Purview erfolgen.
- Wählen Sie Unified Catalog die Option Katalogverwaltung und dann Anforderungen aus.
- Wählen Sie die Domäne Personal Health aus.
- Wählen Sie die von Ihnen übermittelte Anforderung aus.
- Nun können die genehmigenden Personen genehmigen oder ablehnen, indem sie antworten auf die Anforderung auswählen.