Rilevamento oggetti (versione 4.0)

Articolo
11/23/2024

Il rilevamento di oggetti è simile all'assegnazione di tag, tuttavia l'API restituisce le coordinate del rettangolo di selezione (in pixel) per ciascun oggetto trovato nell'immagine. Se, ad esempio, un’immagine contiene un cane, un gatto e una persona, l'operazione di rilevamento oggetti elenca tali oggetti insieme alle rispettive coordinate nell'immagine. È possibile usare questa funzionalità per elaborare le relazioni tra gli oggetti in un'immagine. Inoltre, è anche possibile determinare se in un'immagine sono presenti più istanze dello stesso oggetto.

La funzione di rilevamento oggetti applica dei tag in base agli oggetti o agli esseri viventi identificati nell'immagine. Attualmente, non esiste alcuna relazione formale tra la tassonomia di assegnazione di tag e quella di rilevamento oggetti. A livello concettuale, la funzione di rilevamento degli oggetti trova solo oggetti e cose viventi, mentre la funzione tag può includere anche termini contestuali come interni, che non possono essere localizzati con rettangoli delimitatori.

Provare le funzionalità di rilevamento degli oggetti in modo rapido e semplice nel browser usando Azure AI Vision Studio.

Provare Vision Studio

Esempio di rilevamento di oggetti

La risposta JSON seguente illustra il risultato restituito dall'API Image Analysis 4.0 durante il rilevamento di oggetti nell'immagine di esempio.

Fotografia di una donna che usa un dispositivo Microsoft Surface in una cucina.

{
    "metadata":
    {
        "width": 1260,
        "height": 473
    },
    "objectsResult":
    {
        "values":
        [
            {
                "name": "kitchen appliance",
                "confidence": 0.501,
                "boundingBox": {"x":730,"y":66,"w":135,"h":85}
            },
            {
                "name": "computer keyboard",
                "confidence": 0.51,
                "boundingBox": {"x":523,"y":377,"w":185,"h":46}
            },
            {
                "name": "Laptop",
                "confidence": 0.85,
                "boundingBox": {"x":471,"y":218,"w":289,"h":226}
            },
            {
                "name": "person",
                "confidence": 0.855,
                "boundingBox": {"x":654,"y":0,"w":584,"h":473}
            }
        ]
    }
}

Limiti

È importante tenere presenti le limitazioni della funzione di rilevamento oggetti per evitare o mitigare gli effetti di eventuali falsi negativi (oggetti non rilevati) e di dettagli limitati.

Generalmente, gli oggetti non vengono rilevati se sono piccoli (di dimensioni inferiori al 5% dell'immagine).
Generalmente, gli oggetti non vengono rilevati se sono troppo ravvicinati (ad esempio, una pila di piatti).
Gli oggetti non vengono differenziati in base alla marca o ai nomi del prodotto (ad esempio, diversi tipi di bibite su uno scaffale di un supermercato). È tuttavia possibile ottenere informazioni sul marchio presente in un'immagine usando la funzionalità per il rilevamento del marchio.

Usare l'API

La funzionalità per il rilevamento di oggetti fa parte dell'API di analisi delle immagini. È possibile richiamare questa API con REST. Includere Objects nel parametro di features query. Quando poi si riceve la risposta JSON completa, analizzare la stringa per individuare il contenuto della sezione "objects".

Passaggio successivo

Richiamare l'API Analizza immagine

Condividi tramite

Rilevamento oggetti (versione 4.0)

Esempio di rilevamento di oggetti

Limiti

Usare l'API

Passaggio successivo

Commenti e suggerimenti

Risorse aggiuntive