Partager via


Gouvernance des données et de l’IA pour data lakehouse

Les principes architecturaux de la gouvernance des données et de l’IA pilier couvrent la façon de gérer de manière centralisée les ressources et l’accès.

Diagramme d’architecture de lakehouse de gouvernance des données pour Databricks.

Principes de la gouvernance des données et de l’IA

  1. unifier les données et la gestion de l’IA

    La gestion des données et de l’IA est la base de l’exécution de la stratégie de gouvernance des données et de l’IA. Elle implique la collecte, l’intégration, l’organisation et la persistance des ressources de données approuvées pour aider les organisations à optimiser leur valeur. Un catalogue unifié stocke de manière centralisée et cohérente toutes vos données et artefacts analytiques, ainsi que les métadonnées associées à chaque objet de données. Il permet aux utilisateurs finaux de découvrir les jeux de données disponibles et de fournir une visibilité de provenance en suivant la traçabilité de toutes les ressources de données.

  2. Unifier les données et la sécurité de l'IA

    Il existe deux ensembles de gouvernance efficace de la sécurité des données : comprendre qui a accès aux données et qui a récemment accédé aux ressources de données. Ces informations sont essentielles pour presque toutes les exigences de conformité pour les industries réglementées et sont fondamentales pour tout programme de gouvernance de la sécurité. Avec un système de sécurité des données unifié, le modèle d’autorisations peut être géré de manière centralisée et cohérente sur toutes les ressources de données. L’accès aux données est audité de manière centralisée avec des fonctionnalités d’alerte et de surveillance pour promouvoir la responsabilité.

  3. Établir des normes de qualité des données

    La qualité des données est essentielle pour dériver des insights précis et significatifs à partir de données. La qualité des données a de nombreuses dimensions, notamment l’exhaustivité, la précision, la validité et la cohérence. Il doit être géré activement pour améliorer la qualité des jeux de données finaux afin que les données servent d’informations fiables et fiables pour les utilisateurs professionnels.

Suivant : Meilleures pratiques pour la gouvernance des données et de l’IA

Consultez Meilleures pratiques pour la gouvernance des données et de l’IA.