Partager via


Obtenir des insights sur la détection des visages

Détection des visages

La détection des visages détecte les visages dans un fichier multimédia, puis agrège les instances de visages similaires en groupes.

Les insights de détection des visages sont générés sous la forme d’une liste classées dans un fichier JSON qui inclut une miniature et un nom ou un ID pour chaque visage. Dans le portail web, la sélection de la miniature d’un visage affiche des informations telles que le nom de la personne (s’il a été reconnu), le pourcentage de la vidéo que la personne apparaît et la biographie de la personne, s’il s’agit d’une célébrité. Vous pouvez également faire défiler entre les instances de la vidéo où la personne apparaît.

Modèle de reconnaissance des célébrités

Le modèle de reconnaissance de célébrités couvre environ 1 million de visages et est basé sur des sources de données couramment demandées. Les visages que Video Indexer ne reconnaît pas en tant que célébrités sont détectés mais laissés sans nom. Vous pouvez créer votre propre modèle de personne personnalisé pour entraîner Video Indexer pour reconnaître les visages qui ne sont pas reconnus par défaut.

Important

Pour prendre en charge les principes de l’IA responsable de Microsoft, l’accès aux fonctionnalités d’identification, de personnalisation et de reconnaissance de célébrités est limité et basé sur les critères d’éligibilité et d’utilisation. Les fonctionnalités d’identification, de personnalisation et de reconnaissance des célébrités sont disponibles pour les clients et partenaires gérés par Microsoft. Pour demander l’accès, utilisez le formulaire d’admission de reconnaissance faciale.

Cas d’usage de détection des visages

La liste suivante décrit des exemples de cas d’usage courants pour la détection des visages :

  • Résumez où un acteur apparaît dans un film ou réutilisez des images en recherchant des visages spécifiques dans des archives organisationnelles pour obtenir des informations sur une célébrité spécifique.
  • Améliorez l’efficacité lorsque vous créez des récits de fonctionnalités à une agence de presse ou à une agence sportive. Les exemples incluent la recherche approfondie d’une célébrité ou d’un joueur de football dans les archives organisationnelles.
  • Utilisez des visages qui apparaissent dans une vidéo pour créer des promotions, des bandes-annonces ou des mises en surbrillance. Video Indexer peut vous aider en ajoutant des images clés, des marqueurs de scène, des horodatages et l’étiquetage afin que les éditeurs de contenu investissent moins de temps dans l’examen de nombreux fichiers.

Termes clés

Terme Définition
Reconnaissance faciale Analyse des images pour identifier les visages qui apparaissent dans les images. Ce processus est implémenté via l’API Visage Azure AI.
Inscription Processus d’inscription d’images d’individus pour la création de modèles afin qu’elles puissent être reconnues. Lorsqu’une personne est inscrite à un système de vérification utilisé pour l’authentification, son modèle est également associé à un identificateur principal utilisé pour déterminer quel modèle comparer au modèle de sonde. Des images et des images de haute qualité qui représentent des variations naturelles dans la façon dont une personne recherche (par exemple, porter des lunettes et non des lunettes) génère des modèles d’inscription de haute qualité.
Modèle Les images inscrites de personnes sont converties en modèles, qui sont ensuite utilisés pour la reconnaissance faciale. Les fonctionnalités interprétables par ordinateur sont extraites d’une ou plusieurs images d’un individu pour créer le modèle de cette personne. Les images d’inscription ou de sonde ne sont pas stockées par l’API Visage, et les images d’origine ne peuvent pas être reconstruites en fonction d’un modèle. La qualité du modèle est un déterminant clé de la précision dans vos résultats.

Afficher le json d’insight avec le portail web

Une fois que vous avez chargé et indexé une vidéo, les insights sont disponibles au format JSON pour téléchargement à l’aide du portail web.

  1. Sélectionnez l’onglet Bibliothèque .
  2. Sélectionnez le média avec lequel vous souhaitez travailler.
  3. Sélectionnez Télécharger et Insights (JSON). Le fichier JSON s’ouvre dans un nouvel onglet de navigateur.
  4. Recherchez la paire de clés décrite dans l’exemple de réponse.

Utilisation de l’API

  1. Utilisez la requête Get Video Index . Nous vous recommandons de passer &includeSummarizedInsights=false.
  2. Recherchez les paires de clés décrites dans l’exemple de réponse.

Important

Lorsque vous passez en revue les détections de visages dans l’interface utilisateur, il se peut que vous ne voyiez pas tous les visages qui apparaissent dans la vidéo. Nous exposons uniquement les groupes de visages qui ont une confiance de plus de 0,5, et le visage doit apparaître pendant un minimum de 4 secondes ou 10 pour cent de la valeur de video_duration. Uniquement lorsque ces conditions sont remplies, nous affichons le visage dans l’interface utilisateur et dans le fichier Insights.json . Vous pouvez toujours récupérer toutes les instances de visage à partir du fichier d’artefact de visage à l’aide de l’API : https://api.videoindexer.ai/{location}/Accounts/{accountId}/Videos/{videoId}/ArtifactUrl[?Faces][&accessToken].

Exemple de réponse

    "faces": [
        {
        "id": 1785,
        "name": "Emily Tran",
        "confidence": 0.7855,
        "description": null,
        "thumbnailId": "fd2720f7-b029-4e01-af44-3baf4720c531",
        "knownPersonId": "92b25b4c-944f-4063-8ad4-f73492e42e6f",
        "title": null,
        "imageUrl": null,
        "thumbnails": [
            {
            "id": "4d182b8c-2adf-48a2-a352-785e9fcd1fcf",
            "fileName": "FaceInstanceThumbnail_4d182b8c-2adf-48a2-a352-785e9fcd1fcf.jpg",
            "instances": [
                {
                "adjustedStart": "0:00:00",
                "adjustedEnd": "0:00:00.033",
                "start": "0:00:00",
                "end": "0:00:00.033"
                }
            ]
            },
            {
            "id": "feff177b-dabf-4f03-acaf-3e5052c8be57",
            "fileName": "FaceInstanceThumbnail_feff177b-dabf-4f03-acaf-3e5052c8be57.jpg",
            "instances": [
                {
                "adjustedStart": "0:00:05",
                "adjustedEnd": "0:00:05.033",
                "start": "0:00:05",
                "end": "0:00:05.033"
                }
            ]
            },
        ]
        }
    ]

Important

Il est important de lire la vue d’ensemble de la note de transparence pour toutes les fonctionnalités vi. Chaque insight a également des notes de transparence de ses propres :

Notes de détection des visages

La détection des visages est un outil pour de nombreuses industries lorsqu’elle est utilisée de manière responsable et soigneuse. Pour respecter la confidentialité et la sécurité des autres, et pour respecter les réglementations locales et globales, nous vous recommandons de suivre ces instructions d’utilisation :

  • Examinez soigneusement la précision des résultats. Pour promouvoir une détection plus précise, vérifiez la qualité de la vidéo. La vidéo de faible qualité peut affecter les insights présentés.
  • Examinez attentivement les résultats si vous utilisez la détection des visages pour l’application de la loi. Les personnes peuvent ne pas être détectées s’ils sont petits, assis, accroupis ou obstrués par des objets ou d’autres personnes. Pour garantir des décisions équitables et de haute qualité, combinez l’automatisation basée sur la détection des visages avec la supervision humaine.
  • N’utilisez pas la détection des visages pour les décisions susceptibles d’avoir des répercussions graves et négatives. Les décisions basées sur une sortie incorrecte peuvent avoir des répercussions graves et négatives. Il est conseillé d’inclure l’examen humain des décisions susceptibles d’avoir des répercussions graves sur les individus.

Composants de détection des visages

Le tableau suivant décrit comment les images d’un fichier multimédia sont traitées pendant la procédure de détection des visages :

Composant Définition
Fichier source L’utilisateur charge le fichier source pour l’indexation.
Détection et agrégation Le détecteur de visages identifie les visages dans chaque cadre. Les visages sont ensuite agrégés et regroupés.
Reconnaissance Le modèle célébrités traite les groupes agrégés pour reconnaître les célébrités. Si vous avez créé votre propre modèle de personnes, il traite également les groupes pour reconnaître d’autres personnes. Si les personnes ne sont pas reconnues, elles sont étiquetées Unknown1, Unknown2, et ainsi de suite.
Valeur de confiance Le cas échéant pour les visages connus ou pour les visages identifiés dans la liste personnalisable, le niveau de confiance estimé de chaque étiquette est calculé sous la forme d’une plage comprise entre 0 et 1. Le score de confiance représente la certitude dans la précision du résultat. Par exemple, une certitude de 82 % est représentée sous la forme d’un score de 0,82.

Exemple de code

Voir tous les exemples pour VI