Comprender la detección de objetos

Completado

La detección de objetos es una forma de visión informática en la que se entrena un modelo para que detecte la presencia y ubicación de una o varias clases de objeto en una imagen. Por ejemplo, un sistema de finalización de la compra habilitado para la inteligencia artificial de un supermercado puede necesitar identificar el tipo y la ubicación de los artículos que compra un cliente.

Imagen con la ubicación y el tipo de frutas detectados

Una predicción de detección de objetos tiene dos componentes:

  • La etiqueta de clase de cada objeto detectado en la imagen. Por ejemplo, podría determinar que una imagen contiene una manzana y dos naranjas.
  • La ubicación de cada objeto dentro de la imagen, que se indica como las coordenadas de un rectángulo delimitador que encierra el objeto.

Usar el servicio de Custom Vision de Azure AI para la detección de objetos

Puede utilizar el servicio Custom Vision de Azure AI para entrenar un modelo de detección de objetos. Para usar el servicio Custom Vision de Azure AI, debe aprovisionar dos tipos de recursos de Azure:

  • Un recurso de entrenamiento (que se usa para entrenar los modelos). Puede ser:
    • Recurso de servicios múltiples de Servicios de Azure AI.
    • Un recurso de Custom Vision de Azure AI (entrenamiento).
  • Un recurso de predicción, usado por las aplicaciones cliente para obtener predicciones del modelo. Puede ser:
    • Recurso de servicios múltiples de Servicios de Azure AI.
    • Un recurso de Custom Vision de Azure AI (predicción).

Puede utilizar un recurso de Servicios de Azure AI multiservicio tanto para el entrenamiento como para la predicción, y puede mezclar y combinar tipos de recursos (por ejemplo, utilizando un recurso de Custom Vision de Azure AI (entrenamiento) para entrenar un modelo que después publicará utilizando un recurso de Servicios de Azure AI multiservicio). Si usa un recurso de varios servicios, la clave y el punto de conexión para el entrenamiento y la predicción serán los mismos.