Data Quality-Bericht in Microsoft Purview Unified Catalog
Der Data Quality-Bericht (DQ) ist ein umfassendes Dokument, das die Qualität der Daten in einem organization oder System auswertet und zusammenfasst. Es umfasst in der Regel Bewertungen verschiedener Datenqualitätsdimensionen und Metriken, die den Beteiligten helfen, die Genauigkeit, Vollständigkeit, Konsistenz, Zuverlässigkeit und Aktualität ihrer Daten zu verstehen. Dieser Data Quality-Bericht ermöglicht es Ihrem Team, den Fortschritt des Integritätsmanagements auf einen Blick nachzuverfolgen und Bereiche zu identifizieren, die mehr Arbeit erfordern, um die Qualität der Daten in Ihrem Datenbestand zu verbessern.
In diesem Artikel wird beschrieben, wie Sie auf diesen Bericht zugreifen können und was das bereitgestellte Datenqualitätsmeasure für Ihr Gesundheitsmanagement bedeutet.
Berichtszwecke
Überwachung und Governance: Um die Qualität der Daten kontinuierlich zu überwachen und zu verwalten, um sicherzustellen, dass sie die Standards und regulatorischen Anforderungen der organization erfüllt.
Entscheidungsunterstützung: Um den Beteiligten zuverlässige Daten für fundierte Geschäftsentscheidungen bereitzustellen.
Identifizieren von Problemen: Um Probleme mit der Datenqualität zu erkennen und zu dokumentieren, um eine rechtzeitige Behebung zu ermöglichen.
Verbesserung der Datenverwaltung: Verbesserung der Datenverwaltungsverfahren, indem die Ursachen von Problemen mit der Datenqualität ermittelt und Korrekturmaßnahmen implementiert werden.
Leistungsmessung: Dient zum Messen der Effektivität von Datenqualitätsinitiativen und zum Nachverfolgen von Verbesserungen im Zeitverlauf.
Kommunikation von Stakeholdern: Um die Datenqualität status und Fortschritte an Beteiligte zu kommunizieren, einschließlich Management, Datenproduktbesitzern, Data Stewards und IT-Teams. Durch die Bereitstellung eines klaren und umfassenden Überblicks über den Zustand der Datenqualität spielen diese Berichte eine entscheidende Rolle bei der Aufrechterhaltung der Integrität und Nützlichkeit von Daten innerhalb eines organization.
Voraussetzungen
Sie benötigen Berechtigungen für Datenintegritätsleser , um Data Estate Health-Informationen anzeigen zu können.
Anzeigen des Integritätsberichts zur Datengovernance
- Öffnen Sie das Microsoft Purview-Portal, und wählen Sie Unified Catalog aus.
- Wählen Sie die Dropdownliste Integritätsverwaltung aus.
- Wählen Sie Berichte aus.
- Wählen Sie den Datenintegritätsbericht aus.
Berichterstellung für Data Quality-Dimensionen
Auf der Übersichtsseite des Berichts werden Datenqualitätsdimensionsbewertungen, Data Quality-Regelhierarchie, Datenqualitäts-status nach Dimension und Data Quality-Dimensionen & Regeltypen behandelt, die für verschiedene Datenressourcen verwendet werden. Die wichtigsten Steuerelemente helfen Ihnen, Ihr allgemeines Integritätsmanagement auf einen Blick zu verstehen.
Verwenden Sie die Filter, um Informationen zu bestimmten Governancedomänen, Datenprodukten oder Datenprodukten in einem bestimmten status anzuzeigen (z. B. Entwurf).
Data Quality-Dimension | Beschreibung |
---|---|
Genauigkeit | Daten sollten reale Entitäten genau darstellen. Kontext ist wichtig! Wenn Sie beispielsweise Kundenadressen speichern, stellen Sie sicher, dass diese mit den tatsächlichen Standorten übereinstimmen. |
Vollständigkeit | Das Ziel dieser Regel besteht darin, die leeren, NULL- oder fehlenden Daten zu identifizieren. Diese Regel überprüft, ob alle Werte vorhanden sind (wenn auch nicht notwendigerweise richtig). |
Übereinstimmung | Diese Regel stellt sicher, dass die Daten Datenformatierungsstandards wie die Darstellung von Datumsangaben, Adressen und zulässigen Werten einhalten. |
Konsistenz | Diese Regel überprüft, ob unterschiedliche Werte desselben Datensatzes mit einer bestimmten Regel übereinstimmen und keine Widersprüche vorliegen. Die Datenkonsistenz stellt sicher, dass die gleichen Informationen in verschiedenen Datensätzen einheitlich dargestellt werden. Wenn Sie über einen Produktkatalog verfügen, sind für instance konsistente Produktnamen und -beschreibungen von entscheidender Bedeutung. |
Pünktlichkeit | Mit dieser Regel soll sichergestellt werden, dass die Daten in so kurzer Zeit wie möglich zugänglich sind. Dadurch wird sichergestellt, dass die Daten auf dem neuesten Stand sind. |
Eindeutigkeit | Diese Regel überprüft, ob Werte nicht dupliziert werden, z. B. wenn es nur einen Datensatz pro Kunde geben soll, gibt es nicht mehrere Datensätze für denselben Kunden. Jeder Kunde, jedes Produkt oder jede Transaktion sollte über einen eindeutigen Bezeichner verfügen. |
Datenqualität Gesamtbewertungen und Dimensionsbewertungen helfen Datenexperten und Datenbestandsbesitzern zu verstehen, wie vollständig, genau, konsistent und vertrauenswürdig ihre Daten sind. Außerdem wird angegeben, welche Verbesserungsmaßnahmen ergriffen werden müssen, um die Qualität ihres Datenbestands zu verbessern.
Tipp
Wenn Sie die Filter verwenden, spiegeln diese KPIs die Bewertungen für die ausgewählten Governancedomänen oder Datenprodukte wider.
Data Quality status nach Dimensionen
Data Quality Dimensionsbewertungen werden für jede Governancedomäne berechnet. Dimensionen, die Regeln zugeordnet sind, und die Bewertung wurde für jede Branchenstandarddimension von Datenobjektspalten zu Datenobjekten und von Datenobjekt zu Datenprodukt- und Governancedomänenebene zusammengefasst. Sie können die Bewertung auf Dimensionsebene pro Governancedomäne herausfiltern, um weitere Details zu untersuchen.
Data Quality-Regeln – Pass- und Fail-Verhältnis
Das Pass- und Fail-Verhältnis von Datenqualitätsregeln wurde für jede DQ-Dimension für Datenprodukte gemessen. Dieses Measure hilft Datenbesitzern und Datenexperten zu verstehen, welcher Prozentsatz der Daten in einem Datenprodukt ungenau, inkonsistent, unvollständig, dupliziert oder nicht wie erwartet aktuell genug ist. Dieses Measure hilft auch, zu untersuchen und zu verstehen, ob die angewendeten Regeln falsch oder die Daten falsch sind.
Data Quality-Detailbericht
Dieser Bericht hilft zu verstehen, wie viele Regeln auf Datenprodukte, Datenressourcen und wichtige Datenelemente angewendet werden, um die Qualität des gesamten Datenbestands der organization zu messen und zu überwachen. Sie können einen Drilldown ausführen, um zu sehen, wie viele Datensätze einer Datenressource für einen Regeltyp fehlgeschlagen sind, welcher Regeltyp besser funktioniert und welche Governancedomäne und Datenprodukte vertrauenswürdige Daten veröffentlichen und verwalten. Sie können die Measures nach Governancedomäne und Datenprodukt filtern, um den aktuellen Zustand zu verstehen und Verbesserungsmaßnahmen zu planen.
Hinweis
- Der Data Quality Health-Bericht weist Abhängigkeiten von Data Health-Steuerelementen und dem Self-Service-Analysemodell für Purview-Metadaten auf. Wenn Kunden die Data Health-Steuerelemente nicht verwenden und purview Unified Catalog Metadaten nicht abonnieren, wird der Data Quality Health-Bericht nicht aktualisiert. Kunden müssen entweder Data Health-Steuerelemente verwenden oder Purview-Metadaten für Self-Service-Analysen abonnieren, um den Data Quality-Integritätsbericht zu aktualisieren.
- Wenn Kunden das Data Quality-Feature nicht verwenden, wird der Data Quality Health-Bericht leer angezeigt, da der Data Quality Health-Bericht mit Daten erstellt wird, die aus der Data Quality-Überprüfungsfunktion generiert werden.