Compartilhar via


Detecção de objetos

Este artigo explica o conceito de detecção de objetos. A detecção de objetos é semelhante à marcação, mas a API retorna as coordenadas da caixa delimitadora (em pixels) para cada objeto encontrado na imagem. Por exemplo, se uma imagem contém um cachorro, um gato e uma pessoa, a operação de detecção de objetos lista esses objetos com suas coordenadas na imagem. Você pode usar essa funcionalidade para processar as relações entre os objetos em uma imagem. Ela também permite saber se há várias instâncias do mesmo objeto em uma imagem.

A função de detecção de objetos aplica marcas com base em objetos ou seres vivos identificados na imagem. Não há relação formal entre a taxonomia de marcação e a taxonomia de detecção de objetos. Em um nível conceitual, a função de detecção de objetos encontra apenas objetos e seres vivos, enquanto a função de tag também pode incluir termos contextuais como interno, que não podem ser localizados com caixas delimitadoras.

Experimente as funcionalidades da detecção de objetos de maneira rápida e fácil no navegador usando o Estúdio de Visão de IA do Azure.

Exemplo de detecção de objetos

A resposta JSON a seguir mostra o que a API de Análise de Imagem retorna ao detectar objetos na imagem de exemplo.

Foto mostrando uma mulher usando um dispositivo do Microsoft Surface em uma cozinha.

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Limitações

É importante observar as limitações da detecção de objetos para que seja possível evitar ou reduzir os efeitos de falsos negativos (objetos ausentes) e a limitação de detalhes.

  • Os objetos geralmente não são detectados se forem pequenos (menos de 5% da imagem).
  • Os objetos geralmente não são detectados se estiverem dispostos próximos uns dos outros (uma pilha de pratos, por exemplo).
  • Os objetos não são diferenciados por marcas ou nomes de produtos (diferentes tipos de refrigerantes na prateleira de uma loja, por exemplo). No entanto, você pode obter informações sobre a marca de uma imagem usando o recurso Detecção de marca.

Usar a API

O recurso de detecção de objeto faz parte da API Analisar Imagem. Você pode chamar essa API por meio de um SDK nativo ou por meio de chamadas REST. Inclua Objects no parâmetro de consulta visualFeatures. Em seguida, quando receber a resposta JSON completa, basta analisar a cadeia de caracteres para o conteúdo da seção objetos.