Guia de Início Rápido: Criar um modelo de classificação de imagens com o portal de Visão Personalizada

Artigo
11/04/2024

Este guia de início rápido explica como usar o portal da Web da Visão Personalizada para criar um modelo de classificação de imagem. Depois de criar um modelo, você poderá testá-lo com novas imagens e, eventualmente, integrá-lo ao próprio aplicativo de reconhecimento de imagem.

Pré-requisitos

Uma assinatura do Azure. Você pode criar uma conta gratuita.
Um conjunto de imagens para treinar seu modelo de classificação. Você pode usar o conjunto de imagens de exemplo no GitHub. Ou você pode escolher suas próprias imagens usando as dicas a seguir.
Um navegador da Web com suporte.

Criar recursos de Visão Personalizada

Para usar o Serviço de Visão Personalizada, você precisará criar os recursos de Treinamento e Previsão da Visão Personalizada no Azure. Para fazer isso no portal do Azure, preencha a janela da caixa de diálogo na página Criar Visão Personalizada para criar um recurso de treinamento e de previsão.

Crie um novo projeto

Navegue até a página da Web da Visão Personalizada e entre com a mesma conta que você usou para entrar no portal do Azure.

Captura de tela mostrando a página de entrada.

Para criar seu primeiro projeto, selecione Novo Projeto. A caixa de diálogo Criar projeto aparecerá.
Insira um nome e uma descrição para o projeto. Em seguida, selecione seu Recurso de Treinamento de Visão Personalizada. Se a sua conta conectada estiver associada a uma conta do Azure, a lista suspensa Recurso exibe todos os recursos compatíveis do Azure.

Observação

Se nenhum recurso estiver disponível, confirme se você entrou no customvision.ai com a mesma conta usada para entrar no portal do Azure. Além disso, confirme se você selecionou o mesmo Diretório no site da Visão Personalizada que o diretório no portal do Azure em que os recursos da Visão Personalizada estão localizados. Em ambos os sites, você pode selecionar seu diretório no menu da conta suspensa no canto superior direito da tela.
Selecione Classificação em Tipos de Projeto. Em Tipos de Classificação, escolha Multirótulo ou Multiclasse, dependendo do seu caso de uso. A classificação multirrótulo aplica qualquer número de suas marcas a uma imagem (zero ou mais), enquanto a classificação multiclasse classifica imagens em categorias simples (cada imagem enviada é classificada na marca mais provável). Você pode alterar o tipo de classificação mais tarde, se desejar.

Em seguida, selecione um dos domínios disponíveis. Cada domínio otimiza o modelo para tipos específicos de imagens, conforme descrito na tabela a seguir. Você poderá alterar o domínio posteriormente se desejar.

Domínio	Finalidade
Genérico	Otimizado para uma ampla gama de tarefas de classificação de imagens. Se nenhum dos outros domínios for apropriado ou se você não tiver certeza de qual domínio escolher, selecione o domínio Genérico.
Alimentos	Otimizado para fotografias de pratos como você os veria no menu de um restaurante. Caso queira classificar fotografias de frutas ou legumes individuais, use o domínio Alimentos.
Pontos de referência	Otimizado para pontos de referência reconhecidos, tanto naturais quanto artificiais. Este domínio funciona melhor quando o ponto de referência está claramente visível na fotografia. Este domínio funciona mesmo quando o ponto de referência está um pouco obstruído devido a pessoas na frente dele.
Varejo	Otimizado para imagens encontradas em um catálogo ou site de compras. Caso deseje uma classificação de alta precisão entre vestidos, calças e camisas, use esse domínio.
Domínios compactos	Otimizados para as restrições de classificação em tempo real em dispositivos móveis. Os modelos gerados por domínios compactos podem ser exportados para serem executados localmente.

Por fim, selecione Criar projeto.

Escolher imagens de treinamento

É recomendável usar pelo menos 30 imagens por marca no conjunto de treinamento inicial. Também é conveniente coletar algumas imagens adicionais para testar o seu modelo após o treinamento.

Para treinar o seu modelo com eficiência, use imagens com variedade de visual. Selecione imagens com variação em:

ângulo da câmera
iluminação
background
estilo do visual
assuntos individuais/agrupados
tamanho
type

Além disso, certifique-se de que todas as suas imagens de treinamento atendam aos seguintes critérios:

Formato .jpg, .png, .bmp ou .gif
não ultrapasse 6 MB em tamanho (4 MB para imagens de previsão)
não tenha menos de 256 pixels na borda mais curta; qualquer imagem menor que isso será escalada verticalmente de maneira automática pelo Serviço de Visão Personalizada

Carregar e marcar imagens

Você pode carregar e marcar manualmente imagens para ajudar a treinar o classificador.

Para adicionar imagens, selecione Adicionar imagens e selecione Procurar arquivos locais. Selecione Abrir para mover para a marcação. Sua seleção de marca é aplicada a todo o grupo de imagens que você carrega, portanto, é mais fácil carregar imagens em grupos separados de acordo com suas marcas aplicadas. Você também poderá alterar as marcas das imagens individuais depois que elas forem carregadas.
Para criar uma marca, digite o texto no campo Minhas Marcas e pressione Enter. Se a marca já existir, ela aparecerá em um menu suspenso. Em um projeto multirótulo, é possível adicionar mais de uma marca às suas imagens, mas em um projeto multiclasse, só é possível adicionar uma. Para finalizar o carregamento das imagens, use o botão Carregar [número] arquivos.
Selecione Concluído depois que as imagens forem carregadas.

Para carregar outro conjunto de imagens, retorne ao topo desta seção e repita as etapas.

Treinar o classificador

Para treinar o classificador, selecione o botão Treinar. O classificador usa todas as imagens atuais para criar um modelo que identifique as qualidades visuais de cada marca. Esse processo pode levar vários minutos.

Captura de tela do botão treinar no canto superior direito da barra de ferramentas de cabeçalho da página da Web.

O processo de treinamento deve levar apenas alguns minutos. Durante esse tempo, informações sobre o processo de treinamento são exibidas na barra Desempenho.

Captura de tela da janela do navegador com detalhes de treinamento na seção principal.

Avaliar o classificador

Após a conclusão do treinamento, o desempenho do modelo é estimado e exibido. O Serviço de Visão Personalizada usa as imagens que você enviou para treinamento para calcular a precisão e a recuperação. A precisão e a recuperação são duas medidas diferentes da eficácia de um classificador:

A precisão indica a fração de classificações identificadas que estão corretas. Por exemplo, se o modelo identificou 100 imagens como cachorros e 99 delas são realmente de cachorros, a precisão é de 99%.
A recuperação indica a fração de classificações reais que foram corretamente identificadas. Por exemplo, se há de fato 100 imagens de maçãs e o modelo identifica 80 como maçãs, a recuperação é de 80%.

Captura de tela dos resultados do treinamento mostrando a precisão geral e o recall e a precisão e o recall de cada marca no classificador.

Limite de probabilidade

Observe o controle deslizante Limite de Probabilidade no painel à esquerda da guia Desempenho. Esse é o nível de confiança que uma previsão precisa ter para ser considerada correto (para fins de cálculo de precisão e recall).

Quando você interpreta chamadas de previsão com um limite de probabilidade alto, elas tendem a retornar resultados com alta precisão às custas do recall – as classificações detectadas são corretas, mas muitas permanecem não detectadas. Um limite de probabilidade baixo tem o resultado oposto – a maior parte das classificações reais é detectada, mas há outros falsos positivos dentro desse conjunto. Com isso em mente, você deve definir o limite de probabilidade de acordo com as necessidades específicas do seu projeto. Posteriormente, ao receber os resultados de previsão no lado do cliente, você deve usar o mesmo valor de limite de probabilidade usado aqui.

Gerenciar iterações de treinamento

Toda vez que você treina o classificador, cria uma iteração com métricas de desempenho atualizadas. É possível exibir todas as iterações no painel à esquerda da guia Desempenho. Também é possível encontrar o botão Excluir, que pode ser usado para excluir uma iteração se ela estiver obsoleta. Ao excluir uma iteração, você exclui qualquer imagem que esteja exclusivamente associada a ela.

Para saber como acessar seus modelos treinados programaticamente, consulte Chamar a API de previsão.

Próxima etapa

Neste guia de início rápido, você aprendeu a criar e treinar um modelo de classificação de imagem usando o portal da Web de Visão Personalizada. A seguir, saiba mais sobre o processo iterativo para melhorar o seu modelo.

Testar e readaptar um modelo

O que é Visão Personalizada?

Compartilhar via