Ottenere informazioni dettagliate sul rilevamento degli oggetti
Rilevamento oggetti
Azure AI Video Indexer rileva oggetti in video come automobili, borse e zaini e portatili.
Oggetti supportati
- airplane
- apple
- zaino
- banana
- guanto da baseball
- letto
- panchina
- bicycle
- boat
- book
- bottiglia
- bowl
- broccolo
- bus
- torta
- car
- carota
- telefonino
- sedia
- clock
- mouse del computer
- divano
- tazza
- tavolo da pranzo
- grafico ad anello
- idrante antincendio
- fork
- frisbee
- asciugacapelli
- borsetta
- hot dog
- tasti di scelta
- aquilone
- knife
- laptop
- microonde
- motorcycle
- mouse del computer
- cravatta
- orange
- oven
- parchimetro
- pizza
- pianta in vaso
- sandwich
- forbici
- sink
- skateboard
- Sci
- snowboard
- cucchiaio
- pallone sportivo
- segnale di stop
- valigia
- tavola da surf
- orsacchiotto
- racchetta da tennis
- toaster
- toilet
- spazzolino
- traffic light
- eseguire il training
- ombrello
- vaso
- bicchiere da vino
Visualizzare il codice JSON di informazioni dettagliate con il portale Web
Dopo aver caricato e indicizzato un video, le informazioni dettagliate sono disponibili in formato JSON per il download tramite il portale Web.
- Selezionare la scheda Libreria .
- Selezionare i supporti con cui si vuole lavorare.
- Selezionare Download (Download) e Insights (JSON).Select Download and the Insights (JSON). Il file JSON viene aperto in una nuova scheda del browser.
- Cercare la coppia di chiavi descritta nella risposta di esempio.
Usare l'API
- Usare la richiesta Recupera indice video . È consigliabile
&includeSummarizedInsights=false
passare . - Cercare le coppie chiave descritte nella risposta di esempio.
Esempio di risposta
Gli oggetti rilevati e rilevati vengono visualizzati in "Oggetti rilevati" nel file di insights.json scaricato. Ogni volta che viene rilevato un oggetto univoco, viene assegnato un ID. Viene inoltre rilevato l'oggetto , ovvero il modello controlla che l'oggetto rilevato restituisca al frame. In caso affermativo, viene aggiunta un'altra istanza alle istanze dell'oggetto con orari di inizio e fine diversi.
In questo esempio, la prima auto è stata rilevata e ha assegnato un ID pari a 1 poiché è stato rilevato anche il primo oggetto. Poi, è stata rilevata un'altra auto e a quell'auto è stato assegnato l'ID 23 dal momento che è stato rilevato il 23° oggetto. Successivamente, la prima auto è apparsa di nuovo e un'altra istanza è stata aggiunta al codice JSON. Ecco il codice JSON risultante:
detectedObjects: [
{
id: 1,
type: "Car",
thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t33",
displayName: "car",
wikiDataId: "Q1420",
instances: [
{
confidence: 0.468,
adjustedStart: "0:00:00",
adjustedEnd: "0:00:02.44",
start: "0:00:00",
end: "0:00:02.44"
},
{
confidence: 0.53,
adjustedStart: "0:03:00",
adjustedEnd: "0:00:03.55",
start: "0:03:00",
end: "0:00:03.55"
}
]
},
{
id: 23,
type: "Car",
thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t34",
displayName: "car",
wikiDataId: "Q1420",
instances: [
{
confidence: 0.427,
adjustedStart: "0:00:00",
adjustedEnd: "0:00:14.24",
start: "0:00:00",
end: "0:00:14.24"
}
]
}
]
Chiave | Definizione |
---|---|
ID | Numero incrementale di ID degli oggetti rilevati nel file multimediale |
Type | Tipo di oggetti, ad esempio Car |
ThumbnailID | GUID che rappresenta un singolo rilevamento dell'oggetto |
displayName | Nome da visualizzare nell'esperienza del portale VI |
WikiDataID | Identificatore univoco nella struttura WikiData |
Istanze | Elenco di tutte le istanze rilevate |
Attendibilità | Punteggio compreso tra 0 e 1 che indica l'attendibilità del rilevamento degli oggetti |
adjustedStart | regolare l'ora di inizio del video quando si usa l'editor |
adjustedEnd | regolata l'ora di fine del video quando si usa l'editor |
Avvio | ora in cui l'oggetto viene visualizzato nel frame |
end | l'ora in cui l'oggetto non viene più visualizzato nel frame |
Componenti
Non sono definiti componenti per il rilevamento degli oggetti.
Nota sulla trasparenza
Importante
È importante leggere la panoramica delle note sulla trasparenza per tutte le funzionalità vi. Ogni informazione ha anche note sulla trasparenza proprie:
- Sono disponibili fino a 20 rilevamenti per fotogrammi per elaborazione standard e avanzata e 35 tracce per classe.
- Le dimensioni degli oggetti non devono essere superiori al 90% del frame. Oggetti molto grandi che si estendono in modo coerente su una grande parte del frame potrebbero non essere riconosciuti.
- Gli oggetti piccoli o sfocati possono essere difficili da rilevare. Possono essere perse o misclassificate (bicchiere di vino, tazza).
- Gli oggetti temporanei e visualizzati in pochissimi fotogrammi potrebbero non essere riconosciuti.
- Altri fattori che potrebbero influire sull'accuratezza del rilevamento degli oggetti includono condizioni di scarsa luce, movimento della fotocamera e occlusioni.
- Video Indexer di Azure per intelligenza artificiale supporta solo oggetti reali. Non è disponibile alcun supporto per l'animazione o CGI. La grafica generata dal computer (ad esempio gli adesivi di notizie) potrebbe produrre risultati strani.
- I binder, le brochure e altri materiali scritti tendono a essere rilevati come "libro".