Partilhar via


Recolher imagens

Para preparar um modelo de deteção de objetos para reconhecer os seus objetos, tem de recolher imagens que contenham esses objetos. Siga as diretrizes sobre a quantidade e a qualidade das imagens para obter os melhores resultados.

Formato e tamanho

As imagens que irá alimentar ao modelo de deteção de objetos necessitam destas características:

  • Formato:

    • JPG
    • PNG
    • BMP
  • Tamanho:

    • 6 MB máximo para a formação
    • largura / altura mínima de 256 x 256 pixels

Quantidade de dados e saldo de dados

É importante carregar imagens suficientes para preparar o modelo de IA. Um bom ponto de partida é ter, pelo menos, 15 imagens por objeto para o conjunto de preparação. Com menos imagens, existe um risco forte de o modelo aprender conceitos que não são relevantes ou são desnecessários. Preparar o modelo com mais imagens deverá aumentar a precisão.

Também deve garantir que os dados estão equilibrados. Se tiver 500 imagens de um objeto e apenas 50 imagens de outro, o conjunto de dados de preparação não estará equilibrado. Esta discrepância poderá fazer com que o modelo seja mais adequado para reconhecer um dos objetos. Para obter resultados mais consistentes, mantenha uma proporção mínima de 1:2 entre o objeto com o menor número de imagens e o que tem mais. Por exemplo, se o objeto com o maior número de imagens tiver 500 imagens, o objeto com o número menor de imagens deverá ter, pelo menos, 250 imagens para a preparação.

Utilizar imagens mais diversificadas

Forneça imagens que representam o que será submetido ao modelo durante a utilização normal. Por exemplo, suponha que está a preparar um modelo para reconhecer maçãs. Se apenas preparar imagens de maçãs em pratos, será possível que não consiga reconhecer consistentemente maçãs em árvores. A inclusão de diferentes imagens permitirá garantir que o modelo não tem desvios e consegue generalizar corretamente. Seguem-se algumas maneiras de tornar o seu conjunto de preparação mais diversificado.

Fundo

Use imagens dos seus objetos em frente a diferentes fundos, por exemplo, fruta em pratos, nas mãos e nas árvores. As fotografias em contexto são melhores do que as fotografias em frente de planos de fundo neutros, porque fornecem mais informações para o classificador.

Fundos das imagens.

Iluminação

Utilize imagens de preparação com iluminação diferente, sobretudo se as imagens utilizadas na deteção tiverem iluminação diferente. Por exemplo, incluem imagens tiradas com flash, alta exposição e assim sucessivamente. Também é útil incluir imagens com saturação, matiz e brilho variados. A câmara do dispositivo provavelmente permite-lhe controlar estas definições.

Iluminação das imagens.

Tamanho do objeto

Forneça imagens em que os objetos são de tamanhos variados, capturando diferentes partes do objeto, por exemplo, uma foto de cachos de bananas e um grande plano de uma única banana. Tamanhos diferentes ajudam o modelo a generalizar melhor.

Tamanhos dos objetos.

Ângulo da câmara

Tente fornecer imagens tiradas de diferentes ângulos. Se todas as fotografias forem tiradas com um conjunto de câmaras fixas, como câmaras de vigilância, atribua uma etiqueta diferente a cada câmara. Tal pode ajudar a evitar a modelação de objetos não relacionados, como postes de eletricidade, como a funcionalidade principal. Atribua etiquetas de câmara mesmo que as câmaras capturem os mesmos objetos.

Ângulos de câmaras.

Resultados inesperados

Os modelos de IA podem aprender incorretamente as características que as imagens têm em comum. Suponha que deseja criar um modelo para distinguir maçãs de citrinos. Se utilizar imagens de maçãs em mãos e de citrinos em pratos brancos, o modelo poderá ser preparado para mãos versus pratos brancos em vez de maçãs versus citrinos.

Resultados inesperados.

Para corrigir isto, utilize a orientação acima sobre treino de imagens mais variadas: forneça imagens com ângulos, planos de fundo, tamanhos de objetos, grupos diferentes e outras variantes.

Introdução à deteção de objetos