Considerar opciones para el etiquetado de imágenes

Completado

La opción más sencilla para etiquetar imágenes para la detección de objetos es usar la interfaz interactiva del portal de Custom Vision de Azure AI. Esta interfaz sugiere automáticamente las regiones que contienen objetos, a las que puede asignar etiquetas o ajustar arrastrando el rectángulo delimitador para incluir el objeto que desea etiquetar.

Además, después de etiquetar un lote inicial de imágenes, puede entrenar el modelo. El etiquetado posterior de imágenes nuevas pueden beneficiarse de la herramienta de etiquetador inteligente del portal, que puede sugerir no solo las regiones, sino también las clases de objeto que contienen.

También puede utilizar una herramienta de etiquetado, como la que se proporciona en Azure Machine Learning Studio o Microsoft Visual Object Tagging Tool (VOTT), a fin de aprovechar otras características, como la asignación de tareas de etiquetado de imágenes a varios miembros de un equipo.

Unidades de medida del rectángulo delimitador

Si decide usar una herramienta de etiquetado distinta del portal de Custom Vision de Azure AI, es posible que tenga que ajustar la salida para que coincida con las unidades de medida que espera Custom Vision de Azure AI API. Los rectángulos delimitadores se definen mediante cuatro valores que representan las coordenadas izquierda (X) y superior (Y) de la esquina superior izquierda del rectángulo delimitador, además del ancho y el alto del mismo rectángulo. Estos valores se expresan como valores proporcionales relativos al tamaño de la imagen de origen. Por ejemplo, considere este rectángulo delimitador:

  • Izquierda: 0,1
  • Superior: 0,5
  • Ancho: 0,5
  • Alto: 0,25

Esto define un cuadro en el que la izquierda se encuentra a 0,1 (una décima) del borde izquierdo de la imagen y la parte superior está a 0,5 (la mitad del alto de la imagen) de la parte superior. El cuadro tiene la mitad del ancho y un cuarto del alto de la imagen general.

En la imagen siguiente se muestra información de etiquetado en formato JSON para los objetos de una imagen.

An image with JSON labels for the objects it contains