Décrire le Catalogue de données Microsoft Purview
L’objectif du Catalogue de données Microsoft Purview est de fournir une plateforme de gouvernance des données et de stimuler la création de valeur métier dans votre organisation. Pour ce faire, il utilise un ensemble complet de fonctionnalités qui s’alignent sur les principes de gouvernance des données. Les sections qui suivent décrivent certaines des principales fonctionnalités du Catalogue de données Microsoft Purview.
Domaines de gouvernance
Domaines de gouvernance : Les domaines de gouvernance constituent une nouvelle façon d’organiser votre patrimoine de données par le biais de concepts métier, tels que Marketing ou Finance, en fournissant un contexte pour vos ressources de données. Un domaine de gouvernance est une limite qui permet la gouvernance, la propriété et la découverte courantes de produits de données et de concepts métier tels que les termes de glossaire, les OKR ou les données critiques. Vous pouvez établir de nombreux types de limites telles que :
- Domaines d’activité fondamentaux : ressources humaines, ventes, finance, chaîne d’approvisionnement, etc.
- Domaines principaux : produit, parties, etc.
- Limites basées sur les fonctions organisationnelles : expérience client, chaîne d’approvisionnement cloud, décisionnel, etc.
Les domaines métier sont connectés à plusieurs autres concepts métier incorporés en tant que fonctionnalités du catalogue de données.
Produits de données
Les domaines métier sont des produits de données. Un produit de données est une construction métier avec un nom, une description, des propriétaires et, surtout, une liste de ressources de données associées. Le produit de données fournit un contexte pour les ressources qui sont incluses dans celui-ci et fournit un cas d’usage pour les consommateurs de données.
Un domaine de gouvernance peut héberger de nombreux produits de données, mais un produit de données est géré par un domaine de gouvernance unique et peut être découvert dans de nombreux domaines.
Un produit de données réussi permet aux consommateurs de données de reconnaître facilement les données précieuses à l’aide de leur langage quotidien et simplifie en même temps les responsabilités de propriété pour ces ressources de données.
Prenons l’exemple où un scientifique des données a créé un ensemble de ressources de données à utiliser par un modèle de données et par d’autres personnes. Bien que le scientifique des données puisse utiliser le catalogue de données pour ajouter un terme de glossaire à toutes les ressources de données pertinentes et ajouter une description à chaque ressource pour la rendre plus pertinente dans la recherche d’informations similaires, cela ne garantit pas qu’un consommateur de données connaîtrait le terme de glossaire à utiliser ou que le consommateur de données trouvera toutes les ressources de données. C’est là qu’intervient un produit de données. Le scientifique des données crée un produit de données qui répertorie toutes les ressources utilisées pour créer le modèle de données. La description fournit un cas d’usage complet, avec des exemples ou des suggestions sur l’utilisation des données. Le scientifique des données est désormais un propriétaire de produit de données et il a amélioré l’expérience de recherche des consommateurs de données en les aidant à obtenir tout ce dont ils ont besoin dans ce produit de données unique.
Termes de glossaire
Les termes de glossaire fournissent un contexte métier critique à vos ressources de données et appliquent également des stratégies qui déterminent comment vos données doivent être gérées, régies et rendues détectables à des fins d’utilisation.
Les termes de glossaire sont des concepts individuels qui définissent l’entreprise, les processus et les systèmes utilisés dans une organisation. Ils peuvent être appliqués dans un patrimoine de données, en relation avec les ressources de données et les produits de données pour fournir un contexte métier à vos utilisateurs.
Les termes sont créés sous des domaines de gouvernance pour créer un contexte spécifique à chaque partie de votre organisation. Par exemple, les ventes et le marketing peuvent utiliser le même terme pour signifier différentes choses, et vos domaines de gouvernance aident votre équipe à faire la différence entre ces significations. Une fois créés, les termes sont mappés à des produits de données pour fournir un contexte pour ces produits de données et fournir une gouvernance des données spécifique en fonction du contexte métier.
Les termes de glossaire fournissent une gouvernance des données basée sur le contexte métier, car ils contiennent désormais des stratégies. Les stratégies d’un terme métier appliquent des objectifs d’intégrité métier spécifiques, des exigences de gouvernance des données et des conditions d’utilisation aux produits de données auxquels un terme est appliqué.
Éléments de données critiques
Tous les éléments de données n’ont pas la même importance ou sensibilité, et dédier des ressources pour gérer la qualité de toutes les données de façon aveugle peut être difficile et coûteux. Les éléments de données critiques (CDE) correspondent à un regroupement logique d’informations importantes dans votre patrimoine de données. Ces regroupements peuvent faciliter la compréhension des données et promouvoir la normalisation. Les règles de qualité des données et les stratégies d’accès peuvent être attachées à ces éléments pour sécuriser davantage les informations sensibles dans votre patrimoine de données.
Par exemple : Un élément de données critique « ID Client » peut mapper « CustID » dans une table et « CID » dans une autre table dans le même conteneur logique. Les utilisateurs peuvent mettre cette valeur en correspondance entre les ressources de données pour établir des connexions et lorsque les producteurs de données créent une ressource, ils peuvent utiliser cet élément comme blueprint pour fournir des informations de qualité au format correct.
Les éléments de données critiques sont créés dans les domaines de gouvernance et peuvent avoir des stratégies définies pour gérer ces informations importantes.
En créant des CDE, les organisations peuvent allouer des ressources stratégiquement, en concentrant les efforts de gouvernance sur les domaines qui ont l’impact le plus significatif sur l’entreprise.
OKR
Les OKR (objectifs et résultats clés) dans Microsoft Purview sont des objectifs stratégiques pouvant être suivis liés aux domaines de gouvernance et aux produits de données pour mettre en évidence la valeur des données métier.
Les OKR lient directement des produits de données à des objectifs métier réels pour mettre en relation l’entreprise et le patrimoine de données. La gouvernance des données n’est pas seulement une tâche informatique ou une meilleure pratique d’ingénierie, c’est une partie essentielle de la génération de valeur.
Stratégies d’accès aux données
Les stratégies d’accès au catalogue de données vous permettent de gérer l’accès à vos produits de données et de configurer un système pour fournir l’accès aux utilisateurs qui le demandent. Favorisez l’innovation et la flexibilité dans votre patrimoine de données en créant des opportunités d’accès en libre-service, tout en respectant les normes de sécurité et de droit d’utilisation.
Rechercher et parcourir
La recherche de données peut prendre du temps, car vous ne savez peut-être pas où trouver les données souhaitées. La recherche permet aux consommateurs de données de trouver facilement les données nécessaires pour leurs charges de travail d’analyse ou de gouvernance. La recherche est très bien si vous savez ce que vous recherchez, mais il existe des moments où les consommateurs de données souhaitent explorer les données qui leur sont disponibles. Le catalogue de données Microsoft Purview offre une navigation qui permet aux utilisateurs d’explorer les données qui leur sont accessibles soit par collection, soit par le biais de la hiérarchie de chaque source de données dans le catalogue.
Gestion de l’intégrité
La gestion de l’intégrité a des fonctionnalités permettant d’améliorer la stratégie et la gestion de la gouvernance de vos données.
Contrôles d’intégrité : Les contrôles d’intégrité des données permettent à votre équipe d’analyser et de suivre votre parcours pour compléter la gouvernance des données en analysant l’intégrité de votre gouvernance et en utilisant les contrôles d’intégrité fournis pour suivre votre progression. Les contrôles d’intégrité des données sont des mesures, des processus et des outils spécifiques implémentés pour surveiller, maintenir et améliorer la qualité, la sécurité et l’intégrité globale des données d’une organisation.
Les avantages des contrôles d’intégrité des données comprennent :
- Qualité des données améliorée : Garantit que les données restent correctes, cohérentes et fiables pour la prise de décision.
- Sécurité renforcée : Protège les données sensibles contre les violations, l’accès non autorisé et la corruption.
- Conformité réglementaire : Aide les organisations à respecter les normes légales et industrielles pour la gestion des données.
- Efficacité opérationnelle : Réduit le temps et les ressources consacrés à la correction des problèmes liés aux données et garantit que les données sont facilement disponibles et utilisables.
- Atténuation des risques : Empêche les erreurs coûteuses et les risques liés aux données qui peuvent résulter d’une mauvaise gestion des données.
En résumé, les contrôles d’intégrité des données sont des composants essentiels d’une stratégie de gouvernance des données complète, aidant les organisations à maintenir l’intégrité, la sécurité et la facilité d’utilisation de leurs ressources de données.
Actions d’intégrité : Les actions de gestion de l’intégrité vous permettent, à vous et à vos utilisateurs, de prendre des mesures pour améliorer l’intégrité et la gouvernance des données dans votre patrimoine de données. Ces actions correspondent aux vérifications effectuées pour calculer le score de contrôle d’intégrité de gouvernance des données d’un produit de données. Répondre à ces actions augmente votre score d’intégrité et favorise un catalogue de données généralement plus utilisable et détectable.
Qualité des données
La Qualité des données Microsoft Purview est une solution complète qui permet aux propriétaires de domaine de gouvernance et de données d’évaluer et de superviser la qualité de leur écosystème de données, ce qui facilite les actions ciblées pour l’amélioration.
La Qualité des données offre aux utilisateurs la possibilité d’évaluer la qualité des données à l’aide de règles sans code/à faible code, notamment des règles OOB (prêtes à l’emploi) et des règles générées par l’IA. Ces règles sont agrégées pour fournir des scores aux niveaux des ressources de données, des produits de données et des domaines de gouvernance, ce qui garantit une visibilité de bout en bout de la qualité des données au sein de chaque domaine. La Qualité des données Microsoft Purview intègre également des fonctionnalités de profilage des données basées sur l’IA
En appliquant la Qualité des données Microsoft Purview, les organisations peuvent mesurer, surveiller et améliorer efficacement la qualité de leurs ressources de données.