Guia de Início Rápido: Criar um modelo de classificação de imagens com o portal de Visão Personalizada
Este guia de início rápido explica como usar o portal da Web da Visão Personalizada para criar um modelo de classificação de imagem. Depois de criar um modelo, você poderá testá-lo com novas imagens e, eventualmente, integrá-lo ao próprio aplicativo de reconhecimento de imagem.
Pré-requisitos
- Uma assinatura do Azure. Você pode criar uma conta gratuita.
- Um conjunto de imagens para treinar seu modelo de classificação. Você pode usar o conjunto de imagens de exemplo no GitHub. Ou você pode escolher suas próprias imagens usando as dicas a seguir.
- Um navegador da Web com suporte.
Criar recursos de Visão Personalizada
Para usar o Serviço de Visão Personalizada, você precisará criar os recursos de Treinamento e Previsão da Visão Personalizada no Azure. Para fazer isso no portal do Azure, preencha a janela da caixa de diálogo na página Criar Visão Personalizada para criar um recurso de treinamento e de previsão.
Crie um novo projeto
Navegue até a página da Web da Visão Personalizada e entre com a mesma conta que você usou para entrar no portal do Azure.
Para criar seu primeiro projeto, selecione Novo Projeto. A caixa de diálogo Criar projeto aparecerá.
Insira um nome e uma descrição para o projeto. Em seguida, selecione seu Recurso de Treinamento de Visão Personalizada. Se a sua conta conectada estiver associada a uma conta do Azure, a lista suspensa Recurso exibe todos os recursos compatíveis do Azure.
Observação
Se nenhum recurso estiver disponível, confirme se você entrou no customvision.ai com a mesma conta usada para entrar no portal do Azure. Além disso, confirme se você selecionou o mesmo Diretório no site da Visão Personalizada que o diretório no portal do Azure em que os recursos da Visão Personalizada estão localizados. Em ambos os sites, você pode selecionar seu diretório no menu da conta suspensa no canto superior direito da tela.
Selecione Classificação em Tipos de Projeto. Em Tipos de Classificação, escolha Multirótulo ou Multiclasse, dependendo do seu caso de uso. A classificação multirrótulo aplica qualquer número de suas marcas a uma imagem (zero ou mais), enquanto a classificação multiclasse classifica imagens em categorias simples (cada imagem enviada é classificada na marca mais provável). Você pode alterar o tipo de classificação mais tarde, se desejar.
Em seguida, selecione um dos domínios disponíveis. Cada domínio otimiza o modelo para tipos específicos de imagens, conforme descrito na tabela a seguir. Você poderá alterar o domínio posteriormente se desejar.
Domínio Finalidade Genérico Otimizado para uma ampla gama de tarefas de classificação de imagens. Se nenhum dos outros domínios for apropriado ou se você não tiver certeza de qual domínio escolher, selecione o domínio Genérico. Alimentos Otimizado para fotografias de pratos como você os veria no menu de um restaurante. Caso queira classificar fotografias de frutas ou legumes individuais, use o domínio Alimentos. Pontos de referência Otimizado para pontos de referência reconhecidos, tanto naturais quanto artificiais. Este domínio funciona melhor quando o ponto de referência está claramente visível na fotografia. Este domínio funciona mesmo quando o ponto de referência está um pouco obstruído devido a pessoas na frente dele. Varejo Otimizado para imagens encontradas em um catálogo ou site de compras. Caso deseje uma classificação de alta precisão entre vestidos, calças e camisas, use esse domínio. Domínios compactos Otimizados para as restrições de classificação em tempo real em dispositivos móveis. Os modelos gerados por domínios compactos podem ser exportados para serem executados localmente. Por fim, selecione Criar projeto.
Escolher imagens de treinamento
É recomendável usar pelo menos 30 imagens por marca no conjunto de treinamento inicial. Também é conveniente coletar algumas imagens adicionais para testar o seu modelo após o treinamento.
Para treinar o seu modelo com eficiência, use imagens com variedade de visual. Selecione imagens com variação em:
- ângulo da câmera
- iluminação
- background
- estilo do visual
- assuntos individuais/agrupados
- tamanho
- type
Além disso, certifique-se de que todas as suas imagens de treinamento atendam aos seguintes critérios:
- Formato .jpg, .png, .bmp ou .gif
- não ultrapasse 6 MB em tamanho (4 MB para imagens de previsão)
- não tenha menos de 256 pixels na borda mais curta; qualquer imagem menor que isso será escalada verticalmente de maneira automática pelo Serviço de Visão Personalizada
Carregar e marcar imagens
Você pode carregar e marcar manualmente imagens para ajudar a treinar o classificador.
Para adicionar imagens, selecione Adicionar imagens e selecione Procurar arquivos locais. Selecione Abrir para mover para a marcação. Sua seleção de marca é aplicada a todo o grupo de imagens que você carrega, portanto, é mais fácil carregar imagens em grupos separados de acordo com suas marcas aplicadas. Você também poderá alterar as marcas das imagens individuais depois que elas forem carregadas.
Para criar uma marca, digite o texto no campo Minhas Marcas e pressione Enter. Se a marca já existir, ela aparecerá em um menu suspenso. Em um projeto multirótulo, é possível adicionar mais de uma marca às suas imagens, mas em um projeto multiclasse, só é possível adicionar uma. Para finalizar o carregamento das imagens, use o botão Carregar [número] arquivos.
Selecione Concluído depois que as imagens forem carregadas.
Para carregar outro conjunto de imagens, retorne ao topo desta seção e repita as etapas.
Treinar o classificador
Para treinar o classificador, selecione o botão Treinar. O classificador usa todas as imagens atuais para criar um modelo que identifique as qualidades visuais de cada marca. Esse processo pode levar vários minutos.
O processo de treinamento deve levar apenas alguns minutos. Durante esse tempo, informações sobre o processo de treinamento são exibidas na barra Desempenho.
Avaliar o classificador
Após a conclusão do treinamento, o desempenho do modelo é estimado e exibido. O Serviço de Visão Personalizada usa as imagens que você enviou para treinamento para calcular a precisão e a recuperação. A precisão e a recuperação são duas medidas diferentes da eficácia de um classificador:
- A precisão indica a fração de classificações identificadas que estão corretas. Por exemplo, se o modelo identificou 100 imagens como cachorros e 99 delas são realmente de cachorros, a precisão é de 99%.
- A recuperação indica a fração de classificações reais que foram corretamente identificadas. Por exemplo, se há de fato 100 imagens de maçãs e o modelo identifica 80 como maçãs, a recuperação é de 80%.
Limite de probabilidade
Observe o controle deslizante Limite de Probabilidade no painel à esquerda da guia Desempenho. Esse é o nível de confiança que uma previsão precisa ter para ser considerada correto (para fins de cálculo de precisão e recall).
Quando você interpreta chamadas de previsão com um limite de probabilidade alto, elas tendem a retornar resultados com alta precisão às custas do recall – as classificações detectadas são corretas, mas muitas permanecem não detectadas. Um limite de probabilidade baixo tem o resultado oposto – a maior parte das classificações reais é detectada, mas há outros falsos positivos dentro desse conjunto. Com isso em mente, você deve definir o limite de probabilidade de acordo com as necessidades específicas do seu projeto. Posteriormente, ao receber os resultados de previsão no lado do cliente, você deve usar o mesmo valor de limite de probabilidade usado aqui.
Gerenciar iterações de treinamento
Toda vez que você treina o classificador, cria uma iteração com métricas de desempenho atualizadas. É possível exibir todas as iterações no painel à esquerda da guia Desempenho. Também é possível encontrar o botão Excluir, que pode ser usado para excluir uma iteração se ela estiver obsoleta. Ao excluir uma iteração, você exclui qualquer imagem que esteja exclusivamente associada a ela.
Para saber como acessar seus modelos treinados programaticamente, consulte Chamar a API de previsão.
Próxima etapa
Neste guia de início rápido, você aprendeu a criar e treinar um modelo de classificação de imagem usando o portal da Web de Visão Personalizada. A seguir, saiba mais sobre o processo iterativo para melhorar o seu modelo.