Introdução ao Vision Studio no Azure
Para usar o serviço Azure AI Vision, você deve primeiro criar um recurso para ele em sua assinatura do Azure. Pode utilizar um dos seguintes tipos de recurso:
- Azure AI Vision: Um recurso específico para serviços de visão. Use esse tipo de recurso se você não pretende usar nenhum outro serviço de IA ou se quiser acompanhar a utilização e os custos do seu recurso AI Vision separadamente.
- Serviços de IA do Azure: um recurso geral que inclui o Azure AI Vision juntamente com muitos outros serviços de IA do Azure, como Azure AI Language, Azure AI Speech e outros. Use esse tipo de recurso se você planeja usar vários serviços de IA do Azure e deseja simplificar a administração e o desenvolvimento.
Depois de criar um recurso, há várias maneiras de usar a API de leitura do Azure AI Vision:
- Estúdio Visão
- API REST
- Kits de desenvolvimento de software (SDKs): Python, C#, JavaScript
Abaixo, vamos nos concentrar no Vision Studio.
Azure AI Vision Studio
O Azure AI Vision Studio dá-lhe acesso às APIs do Azure AI Vision através de uma interface gráfica do utilizador que não requer codificação para começar.
Ao abrir o Vision Studio, você precisa selecionar seu recurso padrão. Seu recurso padrão no Vision Studio deve ser um recurso de serviços de IA do Azure, em vez de um recurso do Azure AI Vision.
Na página inicial do Vision Studio, você pode selecionar Reconhecimento ótico de caracteres e o bloco Extrair texto de imagens para experimentar o mecanismo de leitura de OCR. Seu recurso começa a incorrer em custos de uso quando é usado para retornar resultados. Usando um de seus próprios arquivos ou um arquivo de exemplo, você pode ver como o mecanismo de leitura OCR retorna os atributos detetados. Esses atributos correspondem ao que a máquina deteta nas caixas delimitadoras.
Nos bastidores, a imagem é analisada em busca de recursos, incluindo pessoas, texto e objetos, e marcada por caixas delimitadoras. As informações detetadas são processadas e os resultados são devolvidos ao utilizador. Os resultados brutos são retornados em JSON e incluem informações sobre os locais das caixas delimitadoras na página e o texto detetado. Lembre-se de que o Vision Studio pode retornar exemplos de OCR, mas para criar seu próprio aplicativo OCR, você precisa trabalhar com um SDK ou API REST.