Condividi tramite


Ottenere informazioni dettagliate sul rilevamento degli oggetti

Rilevamento oggetti

Azure AI Video Indexer rileva oggetti in video come automobili, borse e zaini e portatili.

Oggetti supportati

  • airplane
  • apple
  • zaino
  • banana
  • guanto da baseball
  • letto
  • panchina
  • bicycle
  • boat
  • book
  • bottiglia
  • bowl
  • broccolo
  • bus
  • torta
  • car
  • carota
  • telefonino
  • sedia
  • clock
  • mouse del computer
  • divano
  • tazza
  • tavolo da pranzo
  • grafico ad anello
  • idrante antincendio
  • fork
  • frisbee
  • asciugacapelli
  • borsetta
  • hot dog
  • tasti di scelta
  • aquilone
  • knife
  • laptop
  • microonde
  • motorcycle
  • mouse del computer
  • cravatta
  • orange
  • oven
  • parchimetro
  • pizza
  • pianta in vaso
  • sandwich
  • forbici
  • sink
  • skateboard
  • Sci
  • snowboard
  • cucchiaio
  • pallone sportivo
  • segnale di stop
  • valigia
  • tavola da surf
  • orsacchiotto
  • racchetta da tennis
  • toaster
  • toilet
  • spazzolino
  • traffic light
  • eseguire il training
  • ombrello
  • vaso
  • bicchiere da vino

Visualizzare il codice JSON di informazioni dettagliate con il portale Web

Dopo aver caricato e indicizzato un video, le informazioni dettagliate sono disponibili in formato JSON per il download tramite il portale Web.

  1. Selezionare la scheda Libreria .
  2. Selezionare i supporti con cui si vuole lavorare.
  3. Selezionare Download (Download) e Insights (JSON).Select Download and the Insights (JSON). Il file JSON viene aperto in una nuova scheda del browser.
  4. Cercare la coppia di chiavi descritta nella risposta di esempio.

Usare l'API

  1. Usare la richiesta Recupera indice video . È consigliabile &includeSummarizedInsights=falsepassare .
  2. Cercare le coppie chiave descritte nella risposta di esempio.

Esempio di risposta

Gli oggetti rilevati e rilevati vengono visualizzati in "Oggetti rilevati" nel file di insights.json scaricato. Ogni volta che viene rilevato un oggetto univoco, viene assegnato un ID. Viene inoltre rilevato l'oggetto , ovvero il modello controlla che l'oggetto rilevato restituisca al frame. In caso affermativo, viene aggiunta un'altra istanza alle istanze dell'oggetto con orari di inizio e fine diversi.

In questo esempio, la prima auto è stata rilevata e ha assegnato un ID pari a 1 poiché è stato rilevato anche il primo oggetto. Poi, è stata rilevata un'altra auto e a quell'auto è stato assegnato l'ID 23 dal momento che è stato rilevato il 23° oggetto. Successivamente, la prima auto è apparsa di nuovo e un'altra istanza è stata aggiunta al codice JSON. Ecco il codice JSON risultante:

detectedObjects: [
    {
    id: 1,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t33",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.468,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:02.44",
        start: "0:00:00",
        end: "0:00:02.44"
        },
        {
        confidence: 0.53,
        adjustedStart: "0:03:00",
        adjustedEnd: "0:00:03.55",
        start: "0:03:00",
        end: "0:00:03.55"
        }    
    ]
    },
    {
    id: 23,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t34",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.427,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:14.24",
        start: "0:00:00",
        end: "0:00:14.24"
        }    
    ]
    }
]
Chiave Definizione
ID Numero incrementale di ID degli oggetti rilevati nel file multimediale
Type Tipo di oggetti, ad esempio Car
ThumbnailID GUID che rappresenta un singolo rilevamento dell'oggetto
displayName Nome da visualizzare nell'esperienza del portale VI
WikiDataID Identificatore univoco nella struttura WikiData
Istanze Elenco di tutte le istanze rilevate
Attendibilità Punteggio compreso tra 0 e 1 che indica l'attendibilità del rilevamento degli oggetti
adjustedStart regolare l'ora di inizio del video quando si usa l'editor
adjustedEnd regolata l'ora di fine del video quando si usa l'editor
Avvio ora in cui l'oggetto viene visualizzato nel frame
end l'ora in cui l'oggetto non viene più visualizzato nel frame

Componenti

Non sono definiti componenti per il rilevamento degli oggetti.

Nota sulla trasparenza

Importante

È importante leggere la panoramica delle note sulla trasparenza per tutte le funzionalità vi. Ogni informazione ha anche note sulla trasparenza proprie:

  • Sono disponibili fino a 20 rilevamenti per fotogrammi per elaborazione standard e avanzata e 35 tracce per classe.
  • Le dimensioni degli oggetti non devono essere superiori al 90% del frame. Oggetti molto grandi che si estendono in modo coerente su una grande parte del frame potrebbero non essere riconosciuti.
  • Gli oggetti piccoli o sfocati possono essere difficili da rilevare. Possono essere perse o misclassificate (bicchiere di vino, tazza).
  • Gli oggetti temporanei e visualizzati in pochissimi fotogrammi potrebbero non essere riconosciuti.
  • Altri fattori che potrebbero influire sull'accuratezza del rilevamento degli oggetti includono condizioni di scarsa luce, movimento della fotocamera e occlusioni.
  • Video Indexer di Azure per intelligenza artificiale supporta solo oggetti reali. Non è disponibile alcun supporto per l'animazione o CGI. La grafica generata dal computer (ad esempio gli adesivi di notizie) potrebbe produrre risultati strani.
  • I binder, le brochure e altri materiali scritti tendono a essere rilevati come "libro".

Codice di esempio

Vedere tutti gli esempi per VI