Introducción a Vision Studio en Azure

Completado

Para usar el servicio Visión de Azure AI, primero debe crear un recurso para él en su suscripción de Azure. Se puede usar cualquiera de los siguientes tipos de recursos:

  • Visión de Azure AI: Un recurso específico para los servicios de visión. Utilice este tipo de recurso si no tiene intención de utilizar ningún otro servicio de IA, o si desea realizar un seguimiento de la utilización y los costos del recurso de Visión de AI por separado.
  • Servicios de Azure AI: Un recurso general que incluye Visión de Azure AI junto con muchos otros servicios de Azure AI, como Lenguaje de Azure AI, Voz de Azure AI y otros. Use este tipo de recurso si tiene previsto usar varias instancias de servicios de Azure AI, y busca simplificar la administración y el desarrollo.

Una vez creado un recurso, hay varias formas de usar Read API de Visión de Azure AI:

  • Vision Studio
  • REST API
  • Kits de desarrollo de software (SDK): Python, C#, JavaScript

A continuación nos centraremos en Vision Studio.

Estudio de Visión de Azure AI

Estudio de Visión de Azure AI le da acceso a las API de Visión de Azure AI a través de una interfaz gráfica de usuario que no requiere codificación para empezar.

A screenshot showing the Vision Studio interface.

Cuando abra Estudio de Visión, deberá seleccionar su recurso predeterminado. Su recurso predeterminado en Estudio de Visión debe ser un recurso de Servicios de Azure AI, en lugar de un recurso de Visión de Azure AI.

En la página de inicio de Estudio de Visión, puede seleccionar Reconocimiento óptico de caracteres y el icono Extraer texto de imágenes para probar el motor de Read OCR. El recurso comienza a incurrir en costos de uso cuando se usa para devolver resultados. Usando uno de sus propios archivos o un archivo de ejemplo, podrá ver cómo el motor de Read OCR devuelve atributos detectados. Estos atributos se corresponden con lo que la máquina detecta en los cuadros delimitadores.

A screenshot showing the detected attributes.

En segundo plano, la imagen se analiza en busca de características como personas, texto y objetos, y se marca con cuadros delimitadores. La información detectada se procesa y los resultados se devuelven al usuario. Los resultados sin procesar se devuelven en JSON e incluyen información sobre la ubicación de los cuadros delimitadores en la página y el texto detectado. Tenga en cuenta que Estudio de Visión puede devolver ejemplos de OCR, pero para desarrollar su propia aplicación de OCR, necesita trabajar con un SDK o una API de REST.

A screenshot showing bounding boxes and the related json returned.