Envisager les options d’étiquetage des images
L’option la plus simple pour étiqueter des images lors de la détection d’objets consiste à utiliser l’interface interactive dans le portail Azure AI Custom Vision. Cette interface suggère automatiquement des régions qui contiennent des objets, régions auxquelles vous pouvez assigner des balises ou que vous pouvez ajuster en faisant glisser le cadre englobant pour entourer l’objet que vous souhaitez étiqueter.
En outre, après avoir balisé un lot initial d’images, vous pouvez effectuer l’apprentissage du modèle. L’étiquetage ultérieur de nouvelles images peut bénéficier de l’outil d’étiquetage intelligent dans le portail, qui peut suggérer non seulement les régions, mais aussi les classes d’objets qu’elles contiennent.
Vous pouvez également utiliser un outil d’étiquetage, tel que celui fourni dans Azure Machine Learning Studio ou l’outil VOTT (Microsoft Visual Object Tagging Tool), pour tirer parti d’autres fonctionnalités, telles que l’affectation de tâches d’étiquetage d’image à plusieurs membres de l’équipe.
Unités de mesure du cadre englobant
Si vous choisissez d’utiliser un outil d’étiquetage autre que le portail Azure AI Custom Vision, vous devrez peut-être ajuster le résultat pour le faire correspondre aux unités de mesure attendues par l’API Azure AI Custom Vision. Les cadres englobants sont définis par quatre valeurs qui représentent les coordonnées gauche (X) et supérieure (Y) de l’angle supérieur gauche du rectangle englobant, ainsi que la largeur et la hauteur du cadre englobant. Ces valeurs sont exprimées sous forme de valeurs proportionnelles par rapport à la taille de l’image source. Par exemple, prenons ce cadre englobant :
- Gauche : 0,1
- Haut : 0,5
- Largeur : 0,5
- Hauteur : 0,25
Ceci définit une zone dans laquelle la gauche se trouve à 0,1 (un dixième) à partir du bord gauche de l’image, tandis que le haut est à 0,5 (la moitié de la hauteur de l’image) à partir du haut. Le cadre fait la moitié de la largeur et un quart de la hauteur de l’image globale.
L’illustration suivante montre les informations d’étiquetage au format JSON pour les objets d’une image.