Partager via


Gouvernance des données et de l’IA pour data lakehouse

Les principes architecturaux du pilier Gouvernance des données et de l’IA couvrent la façon de gérer de manière centralisée les ressources et l’accès.

Diagramme d’architecture de lakehouse de gouvernance des données pour Databricks.

Principes de la gouvernance des données et de l’IA

  1. Unifier la gestion des données et de l’IA

    La gestion des données et de l’IA est la base de l’exécution de la stratégie de gouvernance des données et de l’IA. Elle implique la collecte, l’intégration, l’organisation et la persistance des ressources de données approuvées pour aider les organisations à optimiser leur valeur. Un catalogue unifié stocke de manière centralisée et cohérente toutes vos données et artefacts analytiques, ainsi que les métadonnées associées à chaque objet de données. Il permet aux utilisateurs finaux de découvrir les jeux de données disponibles et de fournir une visibilité de provenance en suivant la traçabilité de toutes les ressources de données.

  2. Unifier la sécurité des données et de l’IA

    La gouvernance efficace de la sécurité des données repose sur deux principes : savoir qui a accès à quelles données et qui a récemment accédé à quelles données. Ces informations sont essentielles pour presque toutes les exigences de conformité pour les secteurs réglementées et sont fondamentales pour tout programme de gouvernance de la sécurité. Avec un système de sécurité des données unifié, le modèle d’autorisations peut être géré de manière centralisée et cohérente sur toutes les ressources de données. L'accès aux données fait l'objet d'un audit centralisé avec des fonctions d'alerte et de contrôle pour promouvoir la responsabilité.

  3. Établir des normes de qualité des données

    La qualité des données est fondamentale pour en tirer des informations précises et significatives. La qualité des données comporte de nombreuses dimensions, notamment l’exhaustivité, l’exactitude, la validité et la cohérence. Il doit être géré activement pour améliorer la qualité des ensembles de données finaux afin que les données constituent des informations fiables et dignes de confiance pour les utilisateurs professionnels.

Suivant : Bonnes pratiques de gouvernance des données

Consultez Bonnes pratiques de gouvernance des données.