Partilhar via


Obtenha informações sobre deteção de rostos

Deteção de rostos

A deteção de rostos deteta rostos em um arquivo de mídia e, em seguida, agrega instâncias de rostos semelhantes em grupos.

As informações de deteção de rosto são geradas como uma lista categorizada em um arquivo JSON que inclui uma miniatura e um nome ou um ID para cada rosto. No portal da Web, selecionar a miniatura de um rosto exibe informações como o nome da pessoa (se ela foi reconhecida), a porcentagem do vídeo que a pessoa aparece e a biografia da pessoa, se ela for uma celebridade. Você também pode rolar entre as ocorrências no vídeo em que a pessoa aparece.

Modelo de reconhecimento de celebridades

O modelo de reconhecimento de celebridades abrange aproximadamente 1 milhão de rostos e é baseado em fontes de dados comumente solicitadas. Rostos que o Video Indexer não reconhece como celebridades são detetados, mas deixados sem nome. Você pode criar seu próprio modelo de pessoa personalizado para treinar o Video Indexer para reconhecer rostos que não são reconhecidos por padrão.

Importante

Para dar suporte aos princípios de IA Responsável da Microsoft, o acesso aos recursos de identificação facial, personalização e reconhecimento de celebridades é limitado e baseado em critérios de elegibilidade e uso. Recursos de identificação facial, personalização e reconhecimento de celebridades estão disponíveis para clientes e parceiros gerenciados pela Microsoft. Para solicitar o acesso, use o formulário de admissão de reconhecimento facial.

Casos de uso de deteção de rosto

A lista a seguir descreve exemplos de casos de uso comuns para deteção de rosto:

  • Resuma onde um ator aparece em um filme ou reutilize imagens pesquisando profundamente rostos específicos em arquivos organizacionais para obter informações sobre uma celebridade específica.
  • Obtenha maior eficiência ao criar reportagens em uma agência de notícias ou agência esportiva. Exemplos incluem a pesquisa profunda de uma celebridade ou um jogador de futebol em arquivos organizacionais.
  • Use rostos que aparecem em um vídeo para criar promoções, trailers ou destaques. O Video Indexer pode ajudar adicionando quadros-chave, marcadores de cena, carimbos de data/hora e rotulagem, para que os editores de conteúdo invistam menos tempo revisando vários arquivos.

Termos principais

Termo Definição
Reconhecimento facial Analisar imagens para identificar os rostos que aparecem nas imagens. Esse processo é implementado por meio da API do Azure AI Face.
Inscrição O processo de inscrição de imagens de indivíduos para a criação de modelos para que eles possam ser reconhecidos. Quando uma pessoa é inscrita em um sistema de verificação usado para autenticação, seu modelo também é associado a um identificador primário que é usado para determinar qual modelo comparar com o modelo de teste. Imagens de alta qualidade e imagens que representam variações naturais na aparência de uma pessoa (por exemplo, usar óculos e não usar óculos) geram modelos de inscrição de alta qualidade.
Modelo As imagens inscritas das pessoas são convertidas em modelos, que são usados para reconhecimento facial. Os recursos interpretáveis por máquina são extraídos de uma ou mais imagens de um indivíduo para criar o modelo desse indivíduo. As imagens de registro ou teste não são armazenadas pela API do Face e as imagens originais não podem ser reconstruídas com base em um modelo. A qualidade do modelo é um fator determinante para a precisão dos seus resultados.

Veja o insight JSON com o portal da Web

Depois de carregar e indexar um vídeo, os insights ficam disponíveis no formato JSON para download usando o portal da Web.

  1. Selecione a guia Biblioteca .
  2. Selecione a mídia com a qual deseja trabalhar.
  3. Selecione Download e o Insights (JSON). O arquivo JSON é aberto em uma nova guia do navegador.
  4. Procure o par de chaves descrito na resposta de exemplo.

Utilizar a API

  1. Use a solicitação Obter índice de vídeo. Recomendamos passar &includeSummarizedInsights=false.
  2. Procure os pares de chaves descritos na resposta de exemplo.

Importante

Quando analisa as deteções de rostos na IU, poderá não ver todas as faces que aparecem no vídeo. Expomos apenas grupos de rostos que tenham uma confiança superior a 0,5, e o rosto deve aparecer por um mínimo de 4 segundos ou 10% do valor de video_duration. Somente quando essas condições são atendidas é que mostramos o rosto na interface do usuário e no arquivo Insights.json . Você sempre pode recuperar todas as instâncias de face do arquivo de artefato de face usando a API: https://api.videoindexer.ai/{location}/Accounts/{accountId}/Videos/{videoId}/ArtifactUrl[?Faces][&accessToken].

Resposta de exemplo

    "faces": [
        {
        "id": 1785,
        "name": "Emily Tran",
        "confidence": 0.7855,
        "description": null,
        "thumbnailId": "fd2720f7-b029-4e01-af44-3baf4720c531",
        "knownPersonId": "92b25b4c-944f-4063-8ad4-f73492e42e6f",
        "title": null,
        "imageUrl": null,
        "thumbnails": [
            {
            "id": "4d182b8c-2adf-48a2-a352-785e9fcd1fcf",
            "fileName": "FaceInstanceThumbnail_4d182b8c-2adf-48a2-a352-785e9fcd1fcf.jpg",
            "instances": [
                {
                "adjustedStart": "0:00:00",
                "adjustedEnd": "0:00:00.033",
                "start": "0:00:00",
                "end": "0:00:00.033"
                }
            ]
            },
            {
            "id": "feff177b-dabf-4f03-acaf-3e5052c8be57",
            "fileName": "FaceInstanceThumbnail_feff177b-dabf-4f03-acaf-3e5052c8be57.jpg",
            "instances": [
                {
                "adjustedStart": "0:00:05",
                "adjustedEnd": "0:00:05.033",
                "start": "0:00:05",
                "end": "0:00:05.033"
                }
            ]
            },
        ]
        }
    ]

Importante

É importante ler a visão geral da nota de transparência para todos os recursos VI. Cada insight também tem notas de transparência próprias:

Notas de deteção de rosto

A deteção de rostos é uma ferramenta para muitas indústrias quando é utilizada de forma responsável e cuidadosa. Para respeitar a privacidade e a segurança de outras pessoas e para cumprir os regulamentos locais e globais, recomendamos que siga estas diretrizes de utilização:

  • Considere cuidadosamente a precisão dos resultados. Para promover uma deteção mais precisa, verifique a qualidade do vídeo. O vídeo de baixa qualidade pode afetar os insights apresentados.
  • Analise cuidadosamente os resultados se você usar a deteção de rosto para aplicação da lei. As pessoas podem não ser detetadas se forem pequenas, sentadas, agachadas ou obstruídas por objetos ou outras pessoas. Para garantir decisões justas e de alta qualidade, combine a automação baseada em deteção de rosto com a supervisão humana.
  • Não use a deteção de rosto para decisões que possam ter impactos adversos graves. As decisões baseadas em resultados incorretos podem ter impactos adversos graves. É aconselhável incluir a revisão humana de decisões que têm o potencial de impactos graves nos indivíduos.

Componentes de deteção de rosto

A tabela a seguir descreve como as imagens em um arquivo de mídia são processadas durante o procedimento de deteção de rosto:

Componente Definição
Ficheiro de origem O usuário carrega o arquivo de origem para indexação.
Deteção e agregação O detetor de rosto identifica as faces em cada quadro. Os rostos são então agregados e agrupados.
Reconhecimento O modelo de celebridades processa os grupos agregados para reconhecer celebridades. Se você criou seu próprio modelo de pessoas, ele também processa grupos para reconhecer outras pessoas. Se as pessoas não forem reconhecidas, elas serão rotuladas como Desconhecido1, Desconhecido2 e assim por diante.
Valor da confiança Quando aplicável a rostos bem conhecidos ou a rostos identificados na lista personalizável, o nível de confiança estimado de cada etiqueta é calculado como um intervalo de 0 a 1. O índice de confiança representa a certeza na precisão do resultado. Por exemplo, uma certeza de 82% é representada como uma pontuação de 0,82.

Código de exemplo

Ver todos os exemplos de VI