Guida alla configurazione dell'indicizzazione

Articolo
11/04/2024

È possibile usare le impostazioni di indicizzazione predefinite oppure modificarle. È possibile scegliere la lingua, l'indicizzazione, i modelli personalizzati e le impostazioni di streaming che hanno implicazioni sulle informazioni dettagliate generate, sui costi e sulle prestazioni.

Questo articolo illustra ognuna delle opzioni. Le stesse opzioni si applicano quando si usa il sito Web di Azure AI Video Indexer come per l'uso dell'API (vedere la guida all'API). Quando si indicizzano volumi di grandi dimensioni, seguire la guida su larga scala.

Impostazioni predefinite

Per impostazione predefinita, Video Indexer di Azure per intelligenza artificiale è configurato come:

Lingua di origine: inglese
Privacy: privato
Impostazione audio e video: standard
Qualità di streaming: velocità in bit singola

Lingua di origine del video

Se si è a conoscenza della lingua parlata nel video, selezionare la lingua nell'elenco delle lingue di origine video. Se non si è certi della lingua del video, scegliere Rileva automaticamente una singola lingua. Azure AI Video Indexer usa l'identificazione della lingua (LID) per rilevare la lingua dei video e generare trascrizione e informazioni dettagliate con la lingua rilevata.

Se il video contiene più lingue e non si è certi di quali, selezionare Rileva automaticamente più lingue. In questo caso, il rilevamento multi-language (MLID) viene applicato durante il caricamento e l'indicizzazione del video.

Anche se la correzione automatica è un'ottima opzione quando la lingua nei video varia, esistono due punti da considerare quando si usa LID o MLID:

LID/MLID non supportano tutti i linguaggi supportati da Azure AI Video Indexer.
La trascrizione è di qualità superiore quando si seleziona la lingua appropriata del video.

Altre informazioni sul supporto linguistico e sulle lingue supportate.

Riservatezza

Questa opzione consente di determinare se le informazioni dettagliate devono essere accessibili solo agli utenti nell'account Di Azure AI Video Indexer o a chiunque abbia un collegamento.

Opzioni di indicizzazione

Ognuna delle opzioni di indicizzazione audio e video potrebbe essere prezzo diversamente quando si usano le impostazioni di indicizzazione predefinite. Per informazioni dettagliate, vedere Prezzi di Video Indexer per intelligenza artificiale di Azure.

Di seguito sono riportate le opzioni del tipo di indicizzazione con i dettagli delle informazioni dettagliate fornite. Per modificare il tipo di indicizzazione, selezionare Impostazioni avanzate.

Nota

Il riconoscimento ottico dei caratteri (OCR) viene usato con diversi tipi di informazioni dettagliate.

Impostazioni avanzate

Solo audio

Basic: indicizza ed estrae informazioni dettagliate usando solo audio (ignorando il video) e fornisce le informazioni dettagliate seguenti: trascrizione, traduzione, formattazione di sottotitoli e sottotitoli di output (sottotitoli chiusi).
Standard: indici ed estrarre informazioni dettagliate usando solo audio (ignorando il video) e fornisce le informazioni dettagliate seguenti: trascrizione, traduzione, formattazione di sottotitoli di output (sottotitoli), rilevamento automatico della lingua, emozioni, parole chiave, entità denominate (marchi, posizioni, persone), sentimenti, relatori, estrazione di argomenti e sottotitolo testuale modalità tenda ration.
Avanzate: indicizza ed estrae informazioni dettagliate usando solo audio (ignorando il video) e fornisce le informazioni dettagliate seguenti: trascrizione, traduzione, formattazione di sottotitoli di output (sottotitoli), rilevamento automatico della lingua, rilevamento automatico degli eventi audio, emozioni, parole chiave, entità denominate (marchi, località, persone), sentiment, relatori, estrazione di argomenti e con modalità tenda ration.

Solo video

Base: indici ed estrarre informazioni dettagliate usando solo video (ignorando l'audio) e fornisce le informazioni dettagliate seguenti: etichette, rilevamento oggetti, OCR, scene (fotogrammi chiave e scatti) e rilevamento dei fotogrammi neri.
Standard: indicizza ed estrae informazioni dettagliate usando solo video (ignorando l'audio) e fornisce le informazioni dettagliate seguenti: etichette (OCR), entità denominate (OCR - marchi, località, persone), OCR, persone, scene (fotogrammi chiave e scatti), fotogrammi neri, con modalità tenda ration ed estrazione di argomenti (OCR).
Avanzate: indici ed estrarre informazioni dettagliate usando solo video (ignorando l'audio) e fornisce le informazioni dettagliate seguenti: etichette (OCR), persona abbinata, entità denominate (OCR - marchi, località, persone), OCR, persone osservate, persone, scene (fotogrammi chiave e scatti), rilevamento delle schede di clapper, rilevamento dei modelli digitali, informazioni dettagliate sui modelli digitali, rilevamento degli abiti senza testo, rilevamento di slate senza testo, rilevamento di logo testuali, fotogrammi neri, con modalità tenda ration ed estrazione di argomenti (OCR).

Audio e video

Base: indici ed estrarre informazioni dettagliate usando audio e video e fornisce le informazioni dettagliate seguenti: trascrizione, traduzione, formattazione di sottotitoli di output (sottotitoli), rilevamento degli oggetti, OCR, scene (fotogrammi chiave e scatti) e fotogrammi neri.
Standard: indici ed estrarre informazioni dettagliate usando audio e video e fornisce le informazioni dettagliate seguenti: trascrizione, traduzione, formattazione di sottotitoli e sottotitoli di output (sottotitoli), rilevamento automatico della lingua, emozioni, parole chiave, entità denominate (marchi, posizioni, persone), OCR, scene (fotogrammi chiave e scatti), fotogrammi neri, con modalità tenda ration, persone, sentimenti, altoparlanti, estrazione di argomenti e testo conmodalità tenda ration.
Avanzate: indici ed estrarre informazioni dettagliate usando audio e video e fornisce le informazioni dettagliate seguenti: trascrizione, traduzione, formattazione di sottotitoli di output (sottotitoli), rilevamento automatico della lingua, rilevamento automatico della lingua, con modalità tenda ration, rilevamento di eventi audio, emozioni, parole chiave, persona abbinata, entità denominate (marchi, località, persone), OCR, persone osservate, rilevamento della lavagna clapper, rilevamento di modelli digitali, in primo piano, in primo piano informazioni dettagliate sull'abbigliamento, rilevamento dello slate senza testo, sentimenti, altoparlanti, scene (fotogrammi chiave e scatti), rilevamento del logo testuale, fotogrammi neri, con modalità tenda razione visiva ed estrazione di argomenti.

Opzioni di qualità dello streaming

Sono disponibili due opzioni per lo streaming di video indicizzati:

Velocità in bit singola: se l'altezza del video è maggiore o uguale a 720p HD, Azure AI Video Indexer lo codifica con una risoluzione di 1280 x 720. In caso contrario, viene codificato come 640 x 468.
Nessun flusso: le informazioni dettagliate vengono generate ma non viene eseguita alcuna operazione di streaming e il video non è disponibile nel sito Web di Azure AI Video Indexer. Quando non è selezionato Nessun flusso, non viene addebitato alcun costo per la codifica.

Escludere i modelli

È possibile escludere i modelli durante l'indicizzazione tramite il sito Web vi e l'API. Quando si carica un video in un indice usando il sito Web, selezionare Impostazioni avanzateImpostazioni> predefinite di indicizzazione e quindi selezionare i modelli di intelligenza artificiale da escludere dai risultati dell'indicizzazione. In questo modo è possibile abilitare l'indicizzazione più efficiente e i risultati vi contenenti solo le informazioni dettagliate a cui si è interessati.

Personalizzazione dei modelli di contenuto

Video Indexer di Intelligenza artificiale di Azure consente di personalizzare alcuni dei relativi modelli da adattare al caso d'uso specifico. Questi modelli includono marchi, lingua, persona e parlato.

Informazioni dettagliate e archiviazione multimediale

Archiviazione delle informazioni dettagliate

Tutte le informazioni dettagliate e i metadati di indicizzazione vengono mantenuti negli account di archiviazione gestiti da VI e non vengono addebitati addebiti per questa risorsa di archiviazione.

Archiviazione multimediale

L'account VI è connesso a un account Archiviazione di Azure. Si controlla e si paga per l'utilizzo di questo account di archiviazione. I file seguenti vengono archiviati in questo account quando viene indicizzato un video:

File di origine. Viene mantenuto nel caso in cui vuoi reindicizzare il video in futuro.
Nuovo file codificato quando la qualità del flusso è impostata su velocità in bit singola.

Eliminazione di supporti

I supporti indicizzati e tutti i relativi file e informazioni dettagliate associati possono essere eliminati in tre modi:

Eliminare i file con il portale di Video Indexer.
Usare la richiesta Elimina video o Elimina file di origine video.
Se non è necessario mantenere il file multimediale originale nella risorsa di archiviazione, quando si usa l'API, impostare il retentionPeriod parametro su compreso tra 1 e 7. Il video indicizzato e tutti gli elementi correlati, il file di origine, le informazioni dettagliate e così via vengono eliminati da 1 a 7 giorni dopo l'indicizzazione.

Condividi tramite