Rapport sur la qualité des données dans Catalogue unifié Microsoft Purview
Le rapport de qualité des données (DQ) est un document complet qui évalue et résume la qualité des données au sein d’un organization ou d’un système. Il comprend généralement des évaluations de diverses dimensions de qualité des données et des métriques pour aider les parties prenantes à comprendre l’exactitude, l’exhaustivité, la cohérence, la fiabilité et l’actualité de leurs données. Ce rapport sur la qualité des données permet à votre équipe de suivre la progression de votre gestion de l’intégrité en un coup d’œil et d’identifier les domaines qui nécessitent plus de travail pour améliorer la qualité des données dans votre patrimoine de données.
Cet article explique comment accéder à ce rapport et ce que signifie la mesure de qualité des données fournie pour votre gestion de l’intégrité.
Objectifs du rapport
Surveillance et gouvernance : pour surveiller et gérer en permanence la qualité des données, en veillant à ce qu’elles répondent aux normes et exigences réglementaires du organization.
Aide à la décision : pour fournir aux parties prenantes des données fiables pour prendre des décisions commerciales éclairées.
Identification des problèmes : pour détecter et documenter les problèmes de qualité des données, ce qui permet une correction en temps voulu.
Amélioration de la gestion des données : pour améliorer les pratiques de gestion des données en identifiant les causes racines des problèmes de qualité des données et en mettant en œuvre des mesures correctives.
Mesure du rendement : pour mesurer l’efficacité des initiatives de qualité des données et suivre les améliorations au fil du temps.
Communication avec les parties prenantes : pour communiquer la qualité des données status et la progression aux parties prenantes, y compris la gestion, les propriétaires de produits de données, les gestionnaires de données et les équipes informatiques. En fournissant une vue claire et complète de l’état de la qualité des données, ces rapports jouent un rôle crucial dans le maintien de l’intégrité et de l’utilité des données dans un organization.
Configuration requise
Vous avez besoin d’autorisations de lecteur d’intégrité des données pour pouvoir afficher les informations d’intégrité du patrimoine des données.
Afficher le rapport d’intégrité de la gouvernance des données
- Ouvrez le portail Microsoft Purview et sélectionnez Catalogue unifié.
- Sélectionnez la liste déroulante Gestion de l’intégrité.
- Sélectionnez Rapports
- Sélectionnez le rapport d’intégrité des données .
Rapports sur la dimension de qualité des données
La page de vue d’ensemble du rapport couvre les scores des dimensions de qualité des données, la hiérarchie des règles de qualité des données, la qualité des données status par dimension et les dimensions de qualité des données & types de règles utilisés pour différentes ressources de données. Les contrôles principaux vous aident à comprendre votre gestion globale de l’intégrité en un coup d’œil.
Utilisez les filtres pour afficher des informations sur des domaines de gouvernance spécifiques, des produits de données ou des produits de données dans un certain status (par exemple, brouillon).
Dimension de qualité des données | Description |
---|---|
Accuracy | Les données doivent représenter avec précision des entités réelles. Le contexte est important ! Par exemple, si vous stockez les adresses des clients, assurez-vous qu’elles correspondent aux emplacements réels. |
Complétude | L’objectif de cette règle est d’identifier les données vides, null ou manquantes. Cette règle vérifie que toutes les valeurs sont présentes (mais pas nécessairement correctes). |
Conformité | Cette règle garantit que les données suivent les normes de mise en forme des données telles que la représentation des dates, des adresses et des valeurs autorisées. |
Consistance | Cette règle vérifie que les différentes valeurs du même enregistrement sont conformes à une règle donnée et qu’il n’y a pas de contradictions. La cohérence des données garantit que les mêmes informations sont représentées uniformément dans différents enregistrements. Par instance, si vous disposez d’un catalogue de produits, des noms et des descriptions de produits cohérents sont essentiels. |
Ponctualité | Cette règle vise à garantir que les données sont accessibles en un laps de temps aussi court que possible. Il garantit que les données sont à jour. |
Unicité | Cette règle vérifie que les valeurs ne sont pas dupliquées, par exemple, s’il n’y a qu’un seul enregistrement par client, il n’y a pas plusieurs enregistrements pour le même client. Chaque client, produit ou transaction doit avoir un identificateur unique. |
Les scores de dimension et de score globaux de qualité des données aident les professionnels des données et les propriétaires de patrimoine de données à comprendre à quel point leurs données sont complètes, précises, cohérentes et fiables. Il indique également quelles actions d’amélioration doivent être prises pour améliorer la qualité de leur patrimoine de données.
Conseil
Si vous utilisez les filtres, ces indicateurs de performance clés reflètent les scores des domaines de gouvernance ou des produits de données sélectionnés.
Qualité des données status par dimensions
Les scores des dimensions de qualité des données sont calculés pour chaque domaine de gouvernance. Dimensions mappées avec des règles, et le score a été aligné sur l’ensemble des colonnes de ressource de données à la ressource de données, et de la ressource de données au niveau du produit de données et du domaine de gouvernance pour chaque dimension standard du secteur. Vous pouvez filtrer le score de niveau de dimensions par domaine de gouvernance pour examiner plus de détails.
Taux de réussite et d’échec des règles de qualité des données
Le taux de réussite et d’échec des règles de qualité des données a été mesuré pour chaque dimension DQ pour les produits de données. Cette mesure permet aux propriétaires de données et aux professionnels des données de comprendre quel pourcentage de données dans un produit de données sont inexactes, incohérentes, incomplètes, dupliquées ou pas suffisamment fraîches comme prévu. Cette mesure permet également d’examiner et de comprendre si les règles appliquées sont incorrectes ou si les données sont incorrectes.
Rapport détaillé sur la qualité des données
Ce rapport permet de comprendre le nombre de règles appliquées aux produits de données, aux ressources de données et aux éléments de données critiques pour mesurer et surveiller la qualité de l’ensemble du patrimoine de données du organization. Vous pouvez explorer pour voir le nombre d’enregistrements d’une ressource de données ayant échoué pour un type de règle, le type de règle qui fonctionne le mieux et le domaine de gouvernance et les produits de données qui publient et gèrent des données dignes de confiance. Vous pouvez filtrer les mesures par domaine de gouvernance et produit de données pour comprendre l’état actuel et planifier des actions d’amélioration.
Remarque
- Le rapport d’intégrité de la qualité des données dépend des contrôles d’intégrité des données et du modèle d’analytique en libre-service des métadonnées Purview. Si les clients n’utilisent pas les contrôles d’intégrité des données et ne s’abonnent pas aux métadonnées Catalogue unifié Purview, le rapport d’intégrité de la qualité des données n’est pas actualisé. Les clients doivent utiliser les contrôles d’intégrité des données ou s’abonner aux métadonnées purview pour l’analytique en libre-service afin d’actualiser le rapport d’intégrité de la qualité des données.
- Si les clients n’utilisent pas la fonctionnalité Data Quality, le rapport Data Quality Health s’affiche vide, car le rapport Data Quality Health est créé à l’aide des données qui génèrent à partir de la fonctionnalité d’analyse de la qualité des données.