Auditer les événements Unity Catalog
Cet article contient des informations de journal d’audit pour les événements Unity Catalog. Unity Catalog capture un journal d’audit des actions effectuées dans le metastore. Cela permet aux administrateurs d’accéder aux détails affinés sur ceux qui ont accédé à un jeu de données donné et aux actions qu’ils ont effectuées.
Configurer les journaux de diagnostic
Pour accéder aux journaux de diagnostic pour les événements du catalogue Unity, vous devez activer et configurer les journaux de diagnostic pour chaque espace de travail de votre compte.
Important
Azure Databricks ne journalise pas les événements Unity Catalog qui se produisent uniquement au niveau du compte. Seuls les événements associés à un espace de travail sont consignés.
Pour créer des tables d’événements Unity Catalog journalisés que vous pouvez interroger :
Créez ou réutilisez un espace de noms Event Hubs.
Cet espace de noms doit se trouver dans la même région que l’espace de travail Azure Databricks.
Voir Démarrage rapide : créer un Event Hub à l’aide du portail Azure.
Créer un hub d’événements dans l’espace de noms.
Copiez la chaîne de connexion pour le Even Hub.
Voir Obtenir une chaîne de connexion Event Hubs.
La stratégie a uniquement besoin de l’autorisation Écouter. La chaîne de connexion doit commencer par
Endpoint=sb://
.Stocker la chaîne de connexion en tant que secret dans l’espace de travail Azure Databricks
Consultez Gérer les secrets.
Activez les journaux de diagnostic pour l'espace de travail dans lequel vous allez traiter les journaux de diagnostic.
Consultez Informations de référence sur les journaux de diagnostic.
Sélectionnez les options suivantes :
- Destination : diffuser en continu vers un hub d’événements
- L’espace de noms Event Hubs et le hub d’événements que vous avez créés aux étapes 1 et 2.
- Catégorie de journal : unityCatalog
Créez un cluster qui utilise le mode d'accès mono-utilisateur.
Importez l’exemple de notebook suivant dans votre espace de travail et attachez-le au cluster que vous venez de créer.
Voir Exporter et importer des notebooks Databricks.
Rapport du journal d’audit pour les événements Unity Catalog
Renseignez les champs de la deuxième cellule de notebook :
<catalog>
: catalogue dans lequel vous souhaitez stocker les tables d’audit (le catalogue doit déjà exister). Vérifiez que vous disposezUSE CATALOG
de privilèges etCREATE
sur celui-ci.<database>
: base de données (schéma) dans laquelle vous souhaitez stocker les tables d’audit (sera créée si elle n’existe pas déjà). S’il existe déjà, vérifiez que vous disposezUSE SCHEMA
de privilèges etCREATE
sur celui-ci.<eh-ns-name>
: nom de l’espace de noms Event Hubs qui contient le hub d’événements<eh-topic-name>
: nom de l’Event Hub (sujet)<secret-scope-name>
: nom de l’étendue du secret qui contient la chaîne de connexion Event Hubs<secret-name>
: nom du secret qui contient la chaîne de connexion Event Hubs<sink-path>
: chemin d’accès DBFS aux points de contrôle Spark ; par exemple/tmp/unity-audit-logs
.
Exécutez le notebook pour créer les tables de connexion d’audit.
Événements du journal d’audit du catalogue Unity
Pour obtenir la liste des événements pouvant être auditables dans Unity Catalog, consultez Événements Unity Catalog.