Comment détecter et masquer les informations d’identification personnelle (PII) dans les conversations
La fonctionnalité PII conversationnelle peut évaluer les conversations pour extraire des informations sensibles (PII) dans le contenu dans plusieurs catégories prédéfinies et les masquer. Cette API fonctionne sur le texte transcrit (référencé en tant que transcriptions) et les conversations. Pour les transcriptions, l’API permet également la réaction des segments audio, qui contient les informations de piI en fournissant les informations de minutage audio pour ces segments audio.
Déterminer le mode de traitement des données (facultatif)
Spécifier le modèle de détection des informations d’identification personnelle
Par défaut, cette fonctionnalité utilise le dernier modèle IA disponible sur votre saisie. Vous pouvez également configurer vos requêtes d’API pour utiliser une version de modèle spécifique.
Support multilingue
Pour découvrir plus de détails, consultez la page Prise en charge des langages pour la détection des informations d’identification personnelle. Actuellement, le modèle en disponibilité générale des informations d’identification personnelle (PII) conversationnelles prend uniquement en charge la langue anglaise. L’API et le modèle en préversion prennent en charge la même liste de langues que les autres services Langue.
Prise en charge de la région
L’API des informations d’identification personnelle conversationnelles prend en charge toutes les régions Azure prises en charge par le service Langue.
Envoi de données
Remarque
Consultez l’article Language Studio pour plus d’informations sur la mise en forme du texte conversationnel à envoyer à l’aide de Language Studio.
Vous pouvez soumettre l’entrée à l’API en tant que liste d’éléments de conversation. L’analyse est effectuée à la réception de la demande. Étant donné que l’API est asynchrone, il peut y avoir un délai entre l’envoi d’une demande d’API et la réception des résultats. Pour connaître la taille et le nombre de requêtes que vous pouvez envoyer par minute et seconde, consultez les limites de données ci-dessous.
Lorsque vous utilisez la fonctionnalité asynchrone, les résultats de l’API sont disponibles pendant 24 heures à partir du moment où la demande a été ingérée, et sont indiqués dans la réponse. Après cette période, les résultats sont purgés et ne sont plus disponibles pour récupération.
Lorsque vous envoyez des données à des informations personnelles conversationnelles, vous pouvez envoyer une conversation (écrite ou parlée) par demande.
L’API tente de détecter les catégories d’entité définies pour une saisie de conversation donnée. Si vous voulez spécifier les entités qui seront détectées et retournées, utilisez le paramètre facultatif piiCategories
avec les catégories d’entités appropriées.
Pour les transcriptions parlées, les entités détectées sont retournées sur la valeur de paramètre redactionSource
fournie. Actuellement, les valeurs prises en charge pour redactionSource
sont text
, lexical
, itn
et maskedItn
(qui mappe aux formats d’API REST de reconnaissance vocale display
\displayText
, lexical
, itn
et maskedItn
respectivement). En outre, pour l’entrée de transcription parlée, cette API fournit également des informations de minutage audio pour permettre la réaction audio. Pour utiliser la fonctionnalité audioRedaction, utilisez l’indicateur facultatif includeAudioRedaction
avec la valeur true
. La réaction audio est effectuée en fonction du format d’entrée lexical.
Remarque
Les informations d’identification personnelle de conversation prennent désormais en charge une taille de document de 40 000 caractères.
Obtention des résultats sur les informations d’identification personnelle
Lorsque vous recevez des résultats de la détection des informations d’identification personnelle, vous pouvez diffuser les résultats dans une application ou enregistrer la sortie dans un fichier sur le système local. La réponse de l’API comprend les entités reconnues, y compris leurs catégories et sous-catégories, ainsi que les scores de confiance. La chaîne de texte avec les entités d’informations d’identification personnelle floutées est également retournée.
Exemples
Accédez à la page de vue d’ensemble de votre ressource dans le portail Azure
Dans le menu de gauche, sélectionnez Clés et point de terminaison. Vous aurez besoin de l’une des clés et du point de terminaison pour authentifier vos demandes d’API.
Téléchargez et installez le package de bibliothèque de clients pour le langage de votre choix :
Langage Version du package .NET 1.0.0 Python 1.0.0 Consultez la documentation de référence suivante pour plus d’informations sur le client et l’objet retourné :
Limites du service et des données
Pour connaître la taille et le nombre de demandes que vous pouvez envoyer par minute et seconde, consultez l’article Limites de service.