Décrire les fonctionnalités de classification des données de la Protection des données Microsoft Purview

Effectué

Les organisations doivent connaître leurs données pour identifier les informations importantes sur le patrimoine et s’assurer que les données sont gérées conformément aux exigences de conformité. Les administrateurs peuvent permettre à leur organisation de connaître ses données via des fonctionnalités de classification et d’explorateur de données disponibles dans le portail Microsoft Purview.

Types d’informations sensibles

Les types d’informations sensibles (SIT) sont des classifieurs basés sur des modèles. Ils disposent de modèles définis qui peuvent être utilisés pour les identifier. Par exemple, un numéro d’identification dans un pays/région peut être basé sur un modèle spécifique, par exemple :

123-456-789-ABC

Microsoft Purview comprend de nombreux types d’informations sensibles intégrés basés sur des modèles définis par une expression régulière (regex) ou une fonction.

Voici quelques exemples :

  • Numéros de carte de crédit
  • Passport ou numéros d’identification
  • Numéros de comptes bancaires
  • Numéros de sécurité sociale

Pour obtenir la liste des types d’informations sensibles intégrés disponibles, reportez-vous aux définitions d’entités de type d’informations sensibles.

La classification des données dans Microsoft Purview prend également en charge la possibilité de créer des types d’informations sensibles personnalisés pour répondre aux besoins spécifiques de l’organisation. Par exemple, une organisation peut avoir besoin de créer des types d’informations sensibles pour des ID d’employés ou des numéros de projet.

Est également prise en charge la classification basée sur la correspondance exacte des données (EDM). La classification basée sur EDM vous permet de créer des types d’informations sensibles personnalisés qui font référence à des valeurs exactes dans une base de données d’informations sensibles. Dans le portail Microsoft Purview, les types d’informations sensibles sont appelés classifieurs EDM.

Les types d’informations sensibles peuvent être utilisés avec des étiquettes de confidentialité et des étiquettes de rétention, et dans de nombreuses solutions Microsoft Purview et Microsoft Priva.

Classificateurs pouvant être formés

Les classifieurs personnalisables utilisent l’intelligence artificielle et le Machine Learning pour classer intelligemment vos données. Ils sont très utiles pour classer les données propres à une organisation, telles que des types spécifiques de contrats, de factures ou d’enregistrements de clients. Cette méthode de classification consiste plutôt à entraîner un classificateur à identifier un élément sur la base de ce qu'il est, et non sur la base des éléments qu'il contient (critères spéciaux). Deux types de classifieurs sont disponibles :

  • Classifieurs préformés : Microsoft a créé et préformé de nombreux classifieurs que vous pouvez utiliser sans formation préalable. Ces classifieurs s’affichent avec l’état Prêt à l’emploi. Microsoft Purview est livré avec cinq classificateurs préentraînés qui détectent et classifient des choses comme les CV, le code source, le harcèlement, les injures et les menaces (liées à des actes de violence ou à la volonté de faire mal).

  • Classifieurs pouvant être formés personnalisés : Microsoft prend en charge la possibilité de créer et d’effectuer l’apprentissage de classifieurs personnalisés. Ils sont très utiles pour classer les données propres à une organisation, telles que des types spécifiques de contrats, de factures ou d’enregistrements de clients.

Pour obtenir un classifieur personnalisé qui identifie précisément un élément comme étant dans une catégorie de contenu particulière, il doit d’abord être formé avec un grand nombre d’exemples du type de contenu de la catégorie. Cette alimentation d’échantillons positifs est appelée amorçage et est utilisée pour créer un modèle de prédiction pour le classifieur.

Le modèle est testé pour déterminer si le classifieur peut faire correctement la distinction entre les éléments qui correspondent à la catégorie et ceux qui ne le sont pas. Le résultat de chaque prédiction est vérifié manuellement, ce qui sert d'entrée pour améliorer la précision du modèle de prédiction.

Une fois le score de précision du modèle stabilisé, le classifieur peut être publié. Les classifieurs pouvant être formés peuvent ensuite trier les éléments dans des emplacements tels que SharePoint Online, Exchange et OneDrive, et classer le contenu.

Notes

À ce stade, les classifieurs ne fonctionnent qu’avec les éléments non chiffrés.

Comprendre et explorer les données

La classification des données peut impliquer un grand nombre de documents et d’e-mails. Pour aider les administrateurs à dériver des insights et à comprendre, le nœud Explorateurs sous Information Protection dans le portail Microsoft Purview fournit des outils tels que l’Explorateur d’activités et l’Explorateur de contenus, qui fournissent des détails en un clin d’œil, notamment :

  • Le nombre d'éléments classés comme informations sensibles et de quelles classifications il s'agit.
  • Détails sur les emplacements des données en fonction de leur sensibilité.
  • Résumé des actions que les utilisateurs prennent sur du contenu sensible au sein de l’organisation.

Les administrateurs peuvent également utiliser les informations obtenues via ces outils pour guider leurs actions.

  • Explorateur de contenus : L’Explorateur de contenus fournit un instantané actuel des éléments qui ont une étiquette de confidentialité ou une étiquette de rétention, ou qui ont été classifiés comme un type d’informations sensibles dans votre organisation. Il permet aux administrateurs disposant des rôles appropriés d’examiner plus en détails les éléments en leur permettant d’accéder à et d’examiner le contenu source analysé qui est stocké dans différents types d’emplacements, comme Exchange, SharePoint et OneDrive.

    L’accès à l’explorateur de contenu est très restreint, car il permet de lire le contenu des fichiers analysés. Un utilisateur qui nécessite l’accès à l’Explorateur de contenus doit avoir un compte dans un ou plusieurs des groupes de rôles de l’Explorateur de contenus.

  • Explorateur d’activités : L'explorateur d’activités fournit une visibilité sur le contenu qui a été découvert et étiqueté, et l’emplacement de ce contenu. Il permet d’analyser ce qui est fait avec le contenu étiqueté au sein de l’organisation. Les administrateurs obtiennent une visibilité sur les activités au niveau du document, comme les modifications et les rétrogradations d’étiquettes (par exemple quand quelqu’un change une étiquette de « confidentiel » en « public »), ou quand des fichiers sont copiés sur un média amovible ou sur un partage réseau.

    Les administrateurs utilisent les filtres pour afficher tous les détails d’une étiquette spécifique, y compris les types de fichiers, les utilisateurs et les activités. L’explorateur d’activités vous permet de comprendre ce qui est fait avec le contenu étiqueté dans le temps. Les administrateurs utilisent l’explorateur d’activités pour évaluer si les contrôles déjà en place sont effectifs.