O que é Visão de IA do Azure?

Artigo
09/03/2024

O serviço Visão de IA do Azure fornece acesso a algoritmos avançados que processam imagens e retornam informações com base nos recursos visuais nos quais você está interessado. A tabela a seguir lista as principais categorias de produtos.

Serviço	Descrição
OCR (reconhecimento óptico de caracteres)	O serviço de OCR (reconhecimento óptico de caracteres) extrai textos de imagens. Você pode usar a API de Leitura para extrair texto impresso e manuscrito de fotos e documentos. Ela usa os modelos baseados em aprendizado profundo e trabalha com textos em uma variedade de superfícies e em segundo plano. Eles incluem documentos comerciais, faturas, recibos, cartazes, cartões de visita, cartas e quadros de comunicação. As APIs de OCR dão suporte à extração de textos impressos em vários idiomas. Siga o guia de início rápido do OCR para obter uma introdução.
Análise de imagens	O serviço de Análise de Imagem extrai muitos recursos visuais de imagens, como objetos, rostos, conteúdo para adulto e descrições de texto geradas automaticamente. Siga o guia de início rápido da Análise de Imagem para obter uma introdução.
Detecção Facial	O serviço de Detecção Facial fornece algoritmos de IA que detectam, reconhecem e analisam rostos humanos em imagens. O software de reconhecimento facial é importante em muitos cenários diferentes, como identificação, controle de acesso sem toque e desfoque de rosto para maior privacidade. Siga o guia de início rápido de Detecção Facial para ver uma introdução.
Análise de Vídeo	A Análise de Vídeo inclui recursos relacionados a vídeo, como Análise Espacial e Recuperação de Vídeo. A Análise Espacial analisa a presença e o movimento de pessoas em um feed de vídeo e produz eventos aos quais outros sistemas podem responder. Instale o contêiner de Análise Espacial para obter uma introdução. A Recuperação de Vídeo permite criar um índice de vídeos que você pode pesquisar com linguagem natural.

Visão de IA do Azure para o gerenciamento de ativos digitais

A Visão de IA do Azure pode alimentar diversos cenários de Gerenciamento de Ativos Digitais (DAM). O DAM é o processo comercial de organizar, armazenar e recuperar ativos de mídia avançados e gerenciar permissões e direitos digitais. Por exemplo, uma empresa pode querer agrupar e identificar imagens com base em logotipos visíveis, rostos, objetos, cores e assim por diante. Ou é possível que você queira gerar legendas para imagens automaticamente e vincular palavras-chave que possam ser pesquisadas. Para obter uma solução de DAM multifuncional usando os serviços da IA do Azure, a Pesquisa de IA do Azure e os relatórios inteligentes, consulte o Guia do acelerador de solução de mineração de conhecimento no GitHub. Para obter outros exemplos de DAM, confira o repositório de Modelos de Solução da Visão de IA do Azure.

Introdução

Use o Vision Studio para experimentar recursos da Visão de IA do Azure rapidamente no seu navegador web.

Para começar a desenvolver a Visão de IA do Azure no seu aplicativo, siga um guia de início rápido.

Requisitos de imagem

A Visão de IA do Azure pode analisar imagens que atendam aos seguintes requisitos:

A imagem deve ser apresentada no formato JPEG, PNG, GIF ou BMP
O tamanho do arquivo da imagem deve ser menor que 4 MB (megabytes)
As dimensões da imagem devem ser maiores que 50 x 50 pixels
- Para a API de Leitura, as dimensões da imagem de entrada precisam estar entre 50 x 50 e 10,000 x 10,000 pixels.

Segurança e privacidade de dados

Como em todos os serviços de IA do Azure, os desenvolvedores que usam o serviço do Visão de IA do Azure devem estar cientes das políticas da Microsoft sobre dados de clientes. Consulte a página de serviços de IA do Azure na Central de Confiabilidade da Microsoft para saber mais.

Próximas etapas

Siga um guia de início rápido para implementar e executar um serviço na linguagem de desenvolvimento de sua preferência.

Compartilhar via