Introdução
Suponhamos que você recebeu milhares de imagens e precisa transferir o texto das imagens para um banco de dados do computador. As imagens digitalizadas têm texto organizado em formatos diferentes e contêm vários idiomas. Quais são algumas maneiras de concluir o projeto em um período razoável e garantir que os dados sejam inseridos com um alto grau de precisão?
Empresas em todo o mundo enfrentam cenários semelhantes todos os dias. Sem os serviços de IA (inteligência artificial), seria desafiador concluir o projeto, especialmente se a escala dele fosse alterada.
Usando serviços de IA, podemos tratar esse projeto como um cenário de pesquisa visual computacional e aplicar o OCR (reconhecimento óptico de caracteres). O OCR permite extrair texto de imagens, como fotos de placas de rua e produtos, bem como de documentos — como manuscritos ou não estruturados.
Para criar uma solução de IA automatizada, você precisa treinar modelos de machine learning para abranger muitos casos de uso. O serviço de Visão de IA do Azure fornece acesso a algoritmos avançados para processar imagens e retorna dados para armazenamento seguro.
Neste módulo, você aprenderá a:
- Identificar como o Serviço de Visão de IA do Azure permite que você leia texto de imagens
- Usar o serviço de Visão de IA do Azure com SDKs e a API REST
- Desenvolver um aplicativo que possa ler texto impresso e manuscrito