Ottenere informazioni dettagliate sul rilevamento degli oggetti

Articolo
10/09/2024

Rilevamento oggetti

Azure AI Video Indexer rileva oggetti in video come automobili, borse e zaini e portatili.

Oggetti supportati

airplane
apple
zaino
banana
guanto da baseball
letto
panchina
bicycle
boat
book
bottiglia
bowl
broccolo
bus
torta

car
carota
telefonino
sedia
clock
mouse del computer
divano
tazza
tavolo da pranzo
grafico ad anello
idrante antincendio
fork
frisbee

asciugacapelli
borsetta
hot dog
tasti di scelta
aquilone
knife
laptop
microonde
motorcycle
mouse del computer
cravatta
orange
oven
parchimetro
pizza
pianta in vaso

sandwich
forbici
sink
skateboard
Sci
snowboard
cucchiaio
pallone sportivo
segnale di stop
valigia
tavola da surf
orsacchiotto

racchetta da tennis
toaster
toilet
spazzolino
traffic light
eseguire il training
ombrello
vaso
bicchiere da vino

Visualizzare il codice JSON di informazioni dettagliate con il portale Web

Dopo aver caricato e indicizzato un video, le informazioni dettagliate sono disponibili in formato JSON per il download tramite il portale Web.

Selezionare la scheda Libreria .
Selezionare i supporti con cui si vuole lavorare.
Selezionare Download (Download) e Insights (JSON).Select Download and the Insights (JSON). Il file JSON viene aperto in una nuova scheda del browser.
Cercare la coppia di chiavi descritta nella risposta di esempio.

Usare l'API

Usare la richiesta Recupera indice video . È consigliabile &includeSummarizedInsights=falsepassare .
Cercare le coppie chiave descritte nella risposta di esempio.

Esempio di risposta

Gli oggetti rilevati e rilevati vengono visualizzati in "Oggetti rilevati" nel file di insights.json scaricato. Ogni volta che viene rilevato un oggetto univoco, viene assegnato un ID. Viene inoltre rilevato l'oggetto , ovvero il modello controlla che l'oggetto rilevato restituisca al frame. In caso affermativo, viene aggiunta un'altra istanza alle istanze dell'oggetto con orari di inizio e fine diversi.

In questo esempio, la prima auto è stata rilevata e ha assegnato un ID pari a 1 poiché è stato rilevato anche il primo oggetto. Poi, è stata rilevata un'altra auto e a quell'auto è stato assegnato l'ID 23 dal momento che è stato rilevato il 23° oggetto. Successivamente, la prima auto è apparsa di nuovo e un'altra istanza è stata aggiunta al codice JSON. Ecco il codice JSON risultante:

detectedObjects: [
    {
    id: 1,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t33",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.468,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:02.44",
        start: "0:00:00",
        end: "0:00:02.44"
        },
        {
        confidence: 0.53,
        adjustedStart: "0:03:00",
        adjustedEnd: "0:00:03.55",
        start: "0:03:00",
        end: "0:00:03.55"
        }    
    ]
    },
    {
    id: 23,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t34",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.427,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:14.24",
        start: "0:00:00",
        end: "0:00:14.24"
        }    
    ]
    }
]

Chiave	Definizione
ID	Numero incrementale di ID degli oggetti rilevati nel file multimediale
Type	Tipo di oggetti, ad esempio Car
ThumbnailID	GUID che rappresenta un singolo rilevamento dell'oggetto
displayName	Nome da visualizzare nell'esperienza del portale VI
WikiDataID	Identificatore univoco nella struttura WikiData
Istanze	Elenco di tutte le istanze rilevate
Attendibilità	Punteggio compreso tra 0 e 1 che indica l'attendibilità del rilevamento degli oggetti
adjustedStart	regolare l'ora di inizio del video quando si usa l'editor
adjustedEnd	regolata l'ora di fine del video quando si usa l'editor
Avvio	ora in cui l'oggetto viene visualizzato nel frame
end	l'ora in cui l'oggetto non viene più visualizzato nel frame

Componenti

Non sono definiti componenti per il rilevamento degli oggetti.

Nota sulla trasparenza

Importante

È importante leggere la panoramica delle note sulla trasparenza per tutte le funzionalità vi. Ogni informazione ha anche note sulla trasparenza proprie:

Sono disponibili fino a 20 rilevamenti per fotogrammi per elaborazione standard e avanzata e 35 tracce per classe.
Le dimensioni degli oggetti non devono essere superiori al 90% del frame. Oggetti molto grandi che si estendono in modo coerente su una grande parte del frame potrebbero non essere riconosciuti.
Gli oggetti piccoli o sfocati possono essere difficili da rilevare. Possono essere perse o misclassificate (bicchiere di vino, tazza).
Gli oggetti temporanei e visualizzati in pochissimi fotogrammi potrebbero non essere riconosciuti.
Altri fattori che potrebbero influire sull'accuratezza del rilevamento degli oggetti includono condizioni di scarsa luce, movimento della fotocamera e occlusioni.
Video Indexer di Azure per intelligenza artificiale supporta solo oggetti reali. Non è disponibile alcun supporto per l'animazione o CGI. La grafica generata dal computer (ad esempio gli adesivi di notizie) potrebbe produrre risultati strani.
I binder, le brochure e altri materiali scritti tendono a essere rilevati come "libro".

Codice di esempio

Vedere tutti gli esempi per VI

Condividi tramite