Compreender a imagem digitalizada
A Imagem Digitalizada é uma área da IA que lida com o processamento visual. Vamos explorar algumas das possibilidades que a imagem digitalizada oferece.
A aplicação Seeing AI é um ótimo exemplo do poder da imagem digitalizada. Concebida para pessoas invisuais e com visão reduzida, a aplicação Seeing AI tira partido da IA para abrir o mundo visual e descrever pessoas, textos e objetos próximos.
Veja o vídeo seguinte para saber mais sobre a aplicação Seeing AI.
Para saber mais, veja a página Web Seeing AI.
Funcionalidades e modelos de Imagem Digitalizada
A maioria das soluções de imagem digitalizada baseia-se em modelos de machine learning que podem ser aplicados à entrada visual de câmaras, vídeos ou imagens. A tabela seguinte descreve as tarefas comuns da imagem digitalizada.
Tarefa | Descrição |
---|---|
Classificação de imagens | A classificação de imagens envolve a preparação de um modelo de machine learning para classificar imagens com base nos respetivos conteúdos. Por exemplo, numa solução de monitorização de trânsito pode utilizar um modelo de classificação de imagens para classificar imagens com base no tipo de veículo que contêm, como táxis, autocarros, ciclistas, entre outros. |
Deteção de objetos | Os modelos de machine learning de deteção de objetos são preparados para classificar objetos individuais numa imagem e identificar a sua localização com uma caixa delimitadora. Por exemplo, uma solução de monitorização de trânsito pode utilizar a deteção de objetos para identificar a localização de diferentes classes de veículos. |
Segmentação semântica | A segmentação semântica é uma técnica de machine learning avançada na qual os píxeis individuais na imagem são classificados de acordo com o objeto ao qual pertencem. Por exemplo, uma solução de monitorização de trânsito pode sobrepor imagens do trânsito com camadas de "máscara" para realçar diferentes veículos com cores específicas. |
Análise de imagem | Pode criar soluções que combinam modelos de machine learning com técnicas avançadas de análise de imagem para extrair informações de imagens, incluindo "etiquetas" que podem ajudar a catalogar a imagem ou até mesmo legendas descritivas que resumem a cena apresentada na imagem. |
Deteção de rostos, análise e reconhecimento | A deteção de rostos é uma forma especializada de deteção de objetos que localiza rostos humanos numa imagem. Isso pode ser combinado com técnicas de classificação e análise de geometria facial para reconhecer indivíduos com base em suas características faciais. |
Reconhecimento ótico de carateres (OCR) | O reconhecimento ótico de carateres é uma técnica utilizada para detetar e ler texto em imagens. Pode utilizar OCR para ler texto em fotografias (por exemplo, sinais de trânsito ou fachadas de lojas) ou para extrair informações de documentos digitalizados como cartas, faturas ou formulários. |
Serviços de imagem digitalizada no Microsoft Azure
Você pode usar o Azure AI Vision da Microsoft para desenvolver soluções de visão computacional. Os recursos de serviço estão disponíveis para uso e teste no Azure Vision Studio e em outras linguagens de programação. Alguns recursos do Azure AI Vision incluem:
- Análise de Imagem: recursos para analisar imagens e vídeos e extrair descrições, tags, objetos e texto.
- Face: capacidades que lhe permitem criar soluções de deteção facial e reconhecimento facial.
- Reconhecimento ótico de caracteres (OCR): recursos para extrair texto impresso ou manuscrito de imagens, permitindo o acesso a uma versão digital do texto digitalizado.