Prise en main des classifieurs avec capacité d’apprentissage
Un classifieur pouvant être entraîné Microsoft Purview est un outil que vous pouvez entraîner pour reconnaître différents types de contenu en lui donnant des exemples à examiner. Une fois l’apprentissage effectué, vous pouvez l’utiliser pour identifier l’élément pour l’application des étiquettes de confidentialité Office, des stratégies de conformité des communications et des stratégies d’étiquette de rétention.
Deux étapes sont nécessaires pour implémenter un classifieur pouvant être formé personnalisé :
- Fournissez deux ensembles d’exemples de données (sélectionnés par des humains).
- Jeu qui contient uniquement les éléments qui appartiennent à la catégorie.
- Jeu qui contient uniquement les éléments qui n’appartiennent pas à la catégorie.
- Testez la capacité du classifieur à détecter les correspondances.
Cet article explique comment créer et tester un classifieur personnalisé.
Pour en savoir plus sur les différents types de classifieurs, consultez En savoir plus sur les classifieurs pouvant être entraînés.
Conseil
Si vous n’êtes pas un client E5, utilisez la version d’évaluation de 90 jours des solutions Microsoft Purview pour découvrir comment des fonctionnalités Supplémentaires purview peuvent aider vos organization à gérer les besoins en matière de sécurité et de conformité des données. Commencez maintenant sur le hub d’évaluation Microsoft Purview. En savoir plus sur les conditions d’inscription et d’essai.
Configuration requise
Conditions d'octroi de licence
Les classifieurs sont une fonctionnalité de conformité Microsoft 365 E3 et E5. Vous devez disposer de l’un de ces abonnements pour pouvoir les utiliser.
Autorisations
Pour utiliser des classifieurs dans les scénarios suivants, vous avez besoin des autorisations suivantes :
Scénario | Autorisations de rôle requises |
---|---|
Stratégie d’étiquette de rétention | Gestion des enregistrements Gestion de la rétention |
Stratégie d’étiquette de confidentialité | Administrateur de sécurité Administrateur de conformité Administrateur de conformité des données |
Stratégie de conformité des communications | Administrateur de gestion des risques internes Administrateur de révision de supervision |
Importante
Par défaut, seul l’utilisateur qui crée un classifieur personnalisé peut entraîner et examiner les prédictions effectuées par ce classifieur.
Préparer un classifieur entraînable personnalisé
Il est utile de comprendre ce qui est impliqué dans la création d’un classifieur pouvant être formé personnalisé avant de vous lancer.
Flux de travail d’installation global
Pour en savoir plus sur le flux de travail global de création de classifieurs pouvant être entraînés personnalisés, consultez le flux de processus de création de classifieurs pouvant être formés personnalisés.
Contenu d’origine
Pour vous assurer que votre classifieur pouvant être entraîné peut identifier de manière indépendante et précise qu’un élément appartient à une catégorie particulière de contenu, vous devez lui présenter de nombreux exemples du type de contenu qui se trouve dans la catégorie. Cette alimentation d’échantillons dans le classifieur pouvant être entraîné est appelée amorçage. Un humain doit être celui qui sélectionne le contenu de départ, et ce contenu doit inclure deux ensembles de données : un qui contient uniquement des éléments qui représentent fortement le contenu que le classifieur est conçu pour détecter (échantillons positifs) et un deuxième ensemble d’éléments qui n’appartiennent clairement pas (exemples négatifs).
Au moins 50 échantillons positifs (jusqu’à 500) et au moins 150 échantillons négatifs (jusqu’à 1500) sont nécessaires pour entraîner un classifieur. Plus vous fournissez d’échantillons, plus les prédictions du classifieur seront précises. Le classifieur pouvant être entraîné traite jusqu’aux 2 000 derniers exemples créés (par horodatage créé par fichier).
Conseil
Pour de meilleurs résultats, vous devez disposer d’au moins 200 éléments dans votre jeu d’échantillons de test qui comprend au moins 50 exemples positifs et au moins 150 exemples négatifs.
Comment créer un classificateur entraînable
Sélectionnez l’onglet approprié pour le portail que vous utilisez. Selon votre plan Microsoft 365, le portail de conformité Microsoft Purview est mis hors service ou sera bientôt mis hors service.
Pour en savoir plus sur le portail Microsoft Purview, consultez Portail Microsoft Purview. Pour en savoir plus sur le portail de conformité, consultez portail de conformité Microsoft Purview.
En préversion : Le processus suivant automatise le test des classifieurs pouvant être entraînés et raccourcit le flux de travail de création de 12 jours à deux jours. (Dans certains cas, le processus ne peut prendre que quelques heures.)
Collectez entre 50 et 500 éléments de contenu initial qui représentent fortement les données que le classifieur doit identifier de manière positive comme faisant partie de la catégorie. Pour obtenir la liste des types de fichiers pris en charge, voir Extensions de nom de fichier analysés par défaut et types de fichiers analysés dans SharePoint Server.
Collectez un deuxième ensemble de contenu initial (de 150 à 1 500 éléments) qui représente des données qui n’appartiennent pas à la catégorie.
Placez le contenu de départ positif et négatif dans des dossiers SharePoint distincts. Chaque dossier doit être dédié à ne contenir que le contenu initial. Notez l’URL du site, de la bibliothèque et du dossier pour chaque ensemble.
Conseil
Si vous créez un site et un dossier SharePoint pour vos données initiales, prévoyez au moins une heure pour que cet emplacement soit indexé avant de créer le classifieur pouvant être formé qui utilisera ces données initiales.
Connectez-vous au portail Microsoft Purview ou au portail de conformité Microsoft Purview avec l’accès au rôle Administrateur de la conformité ou Administrateur de la sécurité, puis accédez à Protection contre la> perte de donnéesClassifieurs declassification> des données.
Choisissez l’onglet Classifieurs pouvant être formés .
Choisissez Créer un classifieur pouvant être entraîné.
Ajoutez la source de vos exemples positifs : sélectionnez l’URL du site, de la bibliothèque et du dossier SharePoint pour le contenu initial qui doit être détecté par le classifieur, puis choisissez Suivant.
Ajoutez la source de vos exemples négatifs : sélectionnez l’URL du site, de la bibliothèque et du dossier SharePoint pour le contenu initial qui doit être ignoré par le classifieur, puis choisissez Suivant.
Passez en revue les paramètres et choisissez Créer un classifieur pouvant être entraîné.
Dans un délai de 24 heures ou moins, le classifieur pouvant être entraîné traite les données initiales et génère un modèle de prédiction. L'état du classificateur est en cours pendant qu'il traite les données de base. Lorsque le classifieur a terminé de traiter les données initiales, la status modifications apportées à l’entraînement est terminée et les éléments ont été testés.
Une fois l’entraînement terminé et les éléments testés (automatiquement), publiez le classifieur en choisissant Publier pour l’utiliser.
Une fois publié, votre classifieur est disponible en tant que condition dans l’étiquetage automatique Office avec des étiquettes de confidentialité, la stratégie d’étiquette de rétention d’application automatique basée sur une condition et dans Conformité des communications.
Tester votre classifieur
Une fois que le classifieur pouvant être entraîné traite suffisamment d’échantillons positifs et négatifs pour générer un modèle de prédiction, vous devez tester les prédictions qu’il effectue. Lors du test du classifieur, vous vérifiez si ses prédictions sont correctes. Une fois toutes les données traitées, passez en revue les résultats manuellement et vérifiez si chaque prédiction est correcte, incorrecte ou si vous n’êtes pas sûr. Microsoft utilise ces commentaires dans l’ensemble pour améliorer le modèle de prédiction.