Créer un schéma SIT EDM et un package de règles (nouvelle expérience)
Vous pouvez créer à la fois le schéma de correspondance de données exacte (EDM) et le type d’informations sensibles (SIT) EDM dans la nouvelle expérience à l’aide d’un flux de travail unique dans le portail de conformité Microsoft Purview.
Conseil
Si vous n’êtes pas un client E5, utilisez la version d’évaluation de 90 jours des solutions Microsoft Purview pour découvrir comment des fonctionnalités Supplémentaires purview peuvent aider vos organization à gérer les besoins en matière de sécurité et de conformité des données. Commencez maintenant sur le hub d’évaluation Microsoft Purview. En savoir plus sur les conditions d’inscription et d’essai.
S’applique à
- Nouvelle expérience
Si vous souhaitez créer un sit EDM à l’aide de l’expérience classique, consultez Créer un sit EDM (expérience classique). Si vous avez besoin d’aide pour choisir l’expérience à utiliser, consultez Choisir l’expérience de création sit EDM adaptée à vos besoins.
Avant de commencer
Veillez à effectuer les étapes décrites dans les articles suivants avant de commencer les procédures décrites dans cet article.
- Exporter des données sources pour obtenir des types d’informations sensibles basés sur la correspondance exacte des données
- Créer l’exemple de fichier SIT EDM (nouvelle expérience)
Si vous n’êtes pas familiarisé avec les SIT basés sur EDM ou leur implémentation, il est essentiel de vous familiariser avec les concepts des articles suivants :
- En savoir plus sur les types d’informations confidentielles.
- En savoir plus sur les types d’informations sensibles exacts basés sur la correspondance de données
- En savoir plus sur la correspondance à plusieurs jetons
- Démarrage avec des types d’informations sensibles basés sur des correspondances de données exactes
- Créer une correspondance exacte des données SIT (Nouvelle expérience)
- Définitions d’entités des types d’informations sensibles
Autorisations
Vous devez disposer des autorisations d’administrateur général ou d’administrateur de conformité pour créer, tester et déployer un type d’informations sensibles personnalisé via le portail de conformité. Pour plus d’informations sur les rôles et les autorisations, consultez À propos des rôles d’administrateur dans Office 365.
Remarques importantes
Voici plusieurs considérations importantes que vous devez prendre en compte lors de la création de votre schéma EDM et de vos SIT basés sur EDM.
Avant de sélectionner vos éléments principaux, passez en revue les SIT intégrés pour avoir une idée de ceux qui répondent le mieux à vos besoins.
Pour chaque sit EDM, vous devez sélectionner au moins un élément principal et pas plus de 10 éléments principaux. Si vous disposez d’un champ de données de corroboration à plusieurs jetons, choisissez l’une des options suivantes :
- Sélectionnez Correspondance à plusieurs jetons.
- Mappez les éléments de vos champs multi-jetons à un sit capable de détecter ce contenu. (Plus vous mappez de champs avec des valeurs uniques, plus votre SIT EDM sera précis. Le mappage de plusieurs champs permet également d’améliorer les performances, de réduire la charge de traitement et d’éviter les délais d’expiration du système.)
Lorsque vous sélectionnez les éléments principaux pour votre sit, sélectionnez des champs qui garantissent que chaque ligne de votre table de données est unique. Par exemple, n’utilisez pas de champs comme
FirstName
ouDateOfBirth
. Pourquoi ? Car les prénoms et les dates de naissance sont susceptibles d’être dupliqués dans votre table de données sensibles. Utilisez plutôt des champs avec des valeurs uniques, telles queSocialSecurityNumber
ouBankAccountNumber
.Recommandation: Créez votre schéma EDM à partir d’un exemple de fichier de données. En suivant cette recommandation, assurez-vous que votre exemple de fichier de données respecte les exigences suivantes :
- Les données doivent être organisées sous forme de table, avec des colonnes et des lignes. Utilisez vos noms de champs pour les en-têtes de colonne. (Les lignes de votre table correspondent à vos éléments de données individuels.)
- Les noms de champs peuvent inclure uniquement des caractères alphanumériques.
- Les noms de champs doivent commencer par une lettre et doivent comporter au moins trois caractères alphanumériques.
- Si ces exigences de nommage ne sont pas remplies, des erreurs peuvent se produire lors du chargement de votre exemple de fichier de données.
Si vous utilisez un exemple de fichier d’informations sensibles pour configurer votre sit EDM, le système suggère le sit existant pour chaque champ qui détecte le mieux les données chargées, si un tel SIT est disponible. Microsoft Purview utilise par défaut la correspondance à jeton unique pour la détection du contenu sensible. Par conséquent, si aucun SIT existant n’est en mesure de détecter les données d’un champ dans votre schéma EDM, il applique le mode de correspondance à jeton unique. Il est essentiel de vous assurer que le SIT suggéré pour chaque élément détecte la chaîne exacte que vous souhaitez surveiller :
- Assurez-vous que le sit suggéré ne contient pas de caractères environnants qui diffèrent du contenu que vous souhaitez détecter.
- Assurez-vous que le sit suggéré n’exclut aucune partie valide de la chaîne telle qu’elle est stockée dans votre table d’informations sensibles.
- Assurez-vous que le sit que vous utilisez correspond étroitement au format des données que vous souhaitez détecter. Par exemple, recherchez quelque chose comme
Nine digits with optional hyphens or spaces
plutôt que simplementdigits
, ou case activée pourA combination of 32 characters consisting of letters and digits
plutôt que simplementtext strings
.
L’utilisation de sits qui correspondent étroitement au format des données que vous essayez de détecter est un autre moyen d’améliorer la précision de vos résultats et de raccourcir le temps nécessaire à la mise en correspondance.
Remarque
Toutes vos données sont enregistrées lorsque vous naviguez vers l’avant (suivant) et vers l’arrière (retour) dans l’outil lors de vos sélections. La navigation vers l’arrière prend uniquement en charge le déplacement d’une page de niveau supérieur à une page de niveau supérieur et d’une sous-page à une sous-page. Vous ne pouvez pas revenir d’une page de niveau supérieur à la sous-page précédente ou d’une sous-page à une page de niveau supérieur précédente.
Créer votre schéma EDM et SIT
La procédure suivante fournit des instructions pas à pas pour créer votre schéma EDM et vos SIT à l’aide de la nouvelle expérience. Pour obtenir une vue d’ensemble conceptuelle et un diagramme du processus dans son ensemble, consultez Vue d’ensemble du flux de travail EDM (nouvelle expérience).
Instructions
Dans le portail de conformité de votre locataire, accédez à Classification des données>Classifieurs EDM.
Vérifiez que le bouton bascule Nouvelle expérience EDM est défini sur Activé.
Choisissez + Créer un classifieur EDM.
Nommez le SIT et ajoutez une description. Le système utilise ce nom, ajouté avec le mot schéma, pour le schéma associé qu’il génère.
Cliquez sur Suivant.
Sélectionnez la méthode que vous souhaitez utiliser pour votre schéma : Charger un fichier contenant des exemples de données ou Définir manuellement votre structure de données. (La meilleure pratique consiste à charger un exemple de fichier de données. Le reste de cette procédure suppose cette option.)
Dans les deux cas, vous avez besoin des informations décrites dans Créer un exemple de fichier SIT EDM (nouvelle expérience) pour votre exemple de fichier.Cliquez sur Suivant.
Sélectionnez votre exemple de fichier, puis sélectionnez Charger le fichier. Cliquez sur Suivant.
(Si des erreurs s’affichent pendant le chargement, traitez-les, puis réessayez.)Dans la page Sélectionner les éléments principaux :
- Dans la colonne Élément principal , sélectionnez votre élément principal. Chaque élément principal doit être mappé à un sit. La meilleure pratique consiste à sélectionner des champs qui affichent la correspondance complète sous la colonne Validation de correspondance.
- Dans la colonne Mode de correspondance pour chaque champ, indiquez les options de correspondance suivantes à appliquer :
- Option 1 : Ne faites rien pour accepter le sit suggéré par le système.
- Option 2 : Développez le menu déroulant. Sous Type d’informations sensibles (SIT), choisissez l’icône crayon (Modifier), puis sélectionnez un autre sit existant.
- Option 3 : Sous Mode de correspondance , sélectionnez Jeton unique.
- Option 4 : Sous Mode de correspondance , sélectionnez Multi-jeton.
Cliquez sur Suivant.
Configurez les paramètres des données dans les colonnes sélectionnées.
- Le bouton bascule Utiliser les mêmes paramètres pour toutes les colonnes est défini sur Activé par défaut. Si vous souhaitez utiliser des paramètres distincts pour chaque champ de données, définissez le bouton bascule sur Désactivé.
- L’option Données dans les colonnes ne respectant pas la casse est sélectionnée par défaut. Pour appliquer la détection respectant la casse , décochez cette case.
- Si nécessaire, sélectionnez l’option Ignorer les délimiteurs et la ponctuation des données dans toutes les colonnes . Vous pouvez ensuite sélectionner les délimiteurs et les signes de ponctuation que vous souhaitez ignorer dans une liste ou entrer des délimiteurs et des signes de ponctuation personnalisés à ignorer.
Importante
Si vous sélectionnez l’option Ignorer les délimiteurs pour la colonne d’élément principal dans votre schéma, assurez-vous que le sit auquel vous mappez est conçu pour faire correspondre les données avec et sans les délimiteurs sélectionnés.
- Choose Submit.
Une fois que vous avez terminé, EDM génère automatiquement une règle de détection pour chacun des éléments principaux que vous avez identifiés. Il crée également une règle de confiance élevée et une règle de confiance moyenne . Les règles de confiance élevée ont plus d’exigences de correspondance que les règles de confiance moyenne, qui, à leur tour, ont plus d’exigences que les règles de confiance faible. (Les règles de faible niveau de confiance doivent être créées manuellement.) Vous pouvez consulter et modifier ces règles dans la page Configurer les règles de détection pour les éléments principaux .
Conseil
Les éléments qui ne sont pas sélectionnés comme éléments primaires peuvent toujours être utilisés comme preuves corroboratives (à l’appui). Plus il y a d’éléments de prise en charge trouvés qui se trouvent dans une proximité définie des éléments primaires, plus la confiance que la correspondance est un vrai positif est élevée.
Recommandations
Attendez au moins une heure après la création ou la modification d’un schéma avant de le télécharger et de l’utiliser pour le chargement des données EDM. Cela permet de s’assurer que le schéma est synchronisé avec le système. Si un schéma est téléchargé trop tôt, un message d’erreur peut s’afficher lors de la tentative de téléchargement du schéma via la ligne de commande.
N’utilisez pas l’agent de chargement EDM pour télécharger, modifier manuellement, puis charger à nouveau un schéma. Cela génère une erreur, car l’utilisation de l’agent de chargement EDM pour télécharger un schéma ajoute des balises au schéma qui ne réussissent pas les vérifications de création de schéma.
Pour vous assurer que toutes les preuves corroboratives sont détectées, effectuez l’une des actions suivantes : - Réduisez les champs de preuve corroborative multi-jetons au nombre maximal de jetons pris en charge par la fonctionnalité multi-jetons (actuellement cinq jetons).
- Mappez le champ multi-jeton à un sit qui peut détecter entièrement les données à plusieurs jetons. - Après avoir créé ou modifié votre sit EDM, testez-le à l’aide de l’applet de commande PowerShell suivante, puis patientez 24 heures avant de le tester dans une solution de stratégie de protection contre la perte de données (DLP).
Test-DataClassification -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]”