Valutare le opzioni per l'etichettatura delle immagini

Completato

L'opzione più semplice per l'etichettatura delle immagini per il rilevamento oggetti consiste nell'usare l'interfaccia interattiva nel portale di Visione personalizzata di Azure AI. Questa interfaccia suggerisce automaticamente le aree che contengono oggetti, cui è possibile assegnare tag o che è possibile modificare trascinando il rettangolo di selezione per racchiudere l'oggetto cui si vuole assegnare un'etichetta.

Inoltre, dopo aver contrassegnato un batch iniziale di immagini, è possibile eseguire il training del modello. L'etichettatura successiva di nuove immagini può trarre vantaggio dallo strumento di etichettatura intelligente nel portale, che può suggerire non solo le aree, ma anche le classi di oggetti che contengono.

In alternativa, è possibile usare uno strumento di etichettatura, ad esempio quello fornito in studio di Azure Machine Learning o Microsoft Visual Object Tagging Tool (VOTT), per sfruttare altre funzionalità, ad esempio l'assegnazione di attività di etichettatura delle immagini a più membri del team.

Unità di misura del rettangolo di selezione

Se si sceglie di usare uno strumento di etichettatura diverso dal portale di Visione personalizzata di Azure AI, può essere necessario modificare l'output in modo che corrisponda alle unità di misura previste dall'API Visione personalizzata di Azure AI. I rettangoli di selezione sono definiti da quattro valori che rappresentano le coordinate sinistra (X) e superiore (Y) dell'angolo superiore sinistro del rettangolo di selezione e la larghezza e l'altezza del rettangolo di selezione. Questi valori sono espressi come valori proporzionali rispetto alle dimensioni dell'immagine di origine. Ad esempio, si consideri questo rettangolo di selezione:

  • Coordinata sinistra: 0,1
  • Coordinata superiore: 0,5
  • Larghezza: 0,5
  • Altezza: 0,25

Definisce una casella in cui la coordinata sinistra si trova a 0,1 (un decimo) dal bordo sinistro dell'immagine e la parte superiore si trova a 0,5 (metà dell'altezza dell'immagine) dall'alto. La casella è metà della larghezza e un quarto dell'altezza dell'immagine complessiva.

L'immagine seguente mostra le informazioni di etichettatura in formato JSON per gli oggetti in un'immagine.

An image with JSON labels for the objects it contains