Konfigurationsguiden för indexering

Artikel
11/04/2024

Du kan använda standardinställningarna för indexering eller justera dem. Du kan välja språk, indexering, anpassade modeller och strömningsinställningar som påverkar de insikter som genereras, kostnader och prestanda.

I den här artikeln beskrivs vart och ett av alternativen. Samma alternativ gäller när du använder Webbplatsen för Azure AI Video Indexer som för att använda API:et (se API-guiden). När du indexerar stora volymer följer du guiden i stor skala.

Standardinställningar

Som standard konfigureras Azure AI Video Indexer som:

Källspråk: Engelska
Sekretess: privat
Inställning för ljud och video: standard
Direktuppspelningskvalitet: enkel bithastighet

Videokällans språk

Om du känner till språket som talas i videon väljer du språket i listan över videokällor. Om du är osäker på språket i videon väljer du Identifiera ett enskilt språk automatiskt. Azure AI Video Indexer använder språkidentifiering (LID) för att identifiera videospråket och generera transkription och insikter med det identifierade språket.

Om videon innehåller flera språk och du inte är säker på vilka, väljer du Identifiera flera språk automatiskt. I det här fallet tillämpas mlid-identifiering (multi-language) vid uppladdning och indexering av videon.

Även om autodetect är ett bra alternativ när språket i dina videor varierar, finns det två saker att tänka på när du använder LID eller MLID:

LID/MLID stöder inte alla språk som stöds av Azure AI Video Indexer.
Transkriptionen är av högre kvalitet när du förväljer videons lämpliga språk.

Läs mer om språkstöd och språk som stöds.

Sekretess

Med det här alternativet kan du avgöra om insikterna endast ska vara tillgängliga för användare i ditt Azure AI Video Indexer-konto eller för någon med en länk.

Indexeringsalternativ

Var och en av alternativen för ljud- och videoindexering kan prissättas på olika sätt när du använder standardinställningarna för indexering. Mer information finns i Priser för Azure AI Video Indexer.

Följande är alternativen för indexeringstyp med information om de insikter som tillhandahålls. Om du vill ändra indexeringstypen väljer du Avancerade inställningar.

Kommentar

Optisk teckenigenkänning (OCR) används med flera insiktstyper.

Avancerade inställningar

Endast ljud

Grundläggande: Indexerar och extraherar insikter med endast ljud (ignorerar video) och ger följande insikter: transkription, översättning, formatering av utdatatexter och undertexter (undertexter).
Standard: Indexerar och extraherar insikter med endast ljud (ignorerar video) och ger följande insikter: transkription, översättning, formatering av bildtexter och undertexter (undertexter), automatisk språkidentifiering, känslor, nyckelord, namngivna entiteter (varumärken, platser, personer), känslor, talare, ämnesextrahering och textkon tältläge ration.
Avancerat: Indexerar och extraherar insikter med endast ljud (ignorerar video) och ger följande insikter: transkription, översättning, formatering av bildtexter och undertexter (undertexter), automatisk språkidentifiering, identifiering av ljudhändelser, känslor, nyckelord, namngivna entiteter (varumärken, platser, personer), sentiment, talare, ämnesextrahering och textbaserad kon tältläge ration.

Endast video

Grundläggande: Indexerar och extraherar insikter med endast video (ignorerar ljud) och ger följande insikter: etiketter, objektidentifiering, OCR, scener (nyckelrutor och bilder) och identifiering av svarta ramar.
Standard: Indexerar och extraherar insikter med endast video (ignorerar ljud) och ger följande insikter: etiketter (OCR), namngivna entiteter (OCR – varumärken, platser, personer), OCR, personer, scener (nyckelrutor och bilder), svarta ramar, visual con tältläge ration och ämnesextrahering (OCR).
Avancerat: Indexerar och extraherar insikter med endast video (ignorerar ljud) och ger följande insikter: etiketter (OCR), matchad person, namngivna entiteter (OCR - varumärken, platser, personer), OCR, observerade personer, personer, scener (nyckelrutor och skott), clapperboardidentifiering, digital mönsteridentifiering, aktuell klädinsikt, textlös skifferidentifiering, textlogotypidentifiering, svarta ramar, visuell con tältläge ration och ämnesextrahering (OCR).

Ljud och video

Grundläggande: Indexerar och extraherar insikter med hjälp av ljud och video och ger följande insikter: transkription, översättning, formatering av bildtexter och undertexter (undertexter), objektidentifiering, OCR, scener (nyckelrutor och bilder) och svarta bildrutor.
Standard: Indexerar och extraherar insikter med hjälp av ljud och video och ger följande insikter: transkription, översättning, formatering av bildtexter och undertexter (undertexter), automatisk språkidentifiering, känslor, nyckelord, namngivna entiteter (varumärken, platser, personer), OCR, scener (nyckelrutor och bilder), svarta ramar, visuell kon tältläge ration, personer, känslor, talare, ämnesextrahering och textkonfigureringtältläge ration.
Avancerat: Indexerar och extraherar insikter med hjälp av ljud och video och ger följande insikter: transkription, översättning, formatering av bildtexter och undertexter (undertexter), automatisk språkidentifiering, textkon tältläge ration, identifiering av ljudhändelser, känslor, nyckelord, matchad person, namngivna entiteter (varumärken, platser, personer), OCR, observerade personer, personer, klappkortsidentifiering, identifiering av digitala mönster, aktuella klädinsikter, textlös skifferidentifiering, sentiment, talare, scener (nyckelramar och bilder), identifiering av textlogotyp, svarta ramar, visual con tältläge ration och extrahering av ämnen.

Alternativ för direktuppspelningskvalitet

Det finns två alternativ för strömmande indexerade videor:

Enkel bithastighet: Om videohöjden är större än eller lika med 720p HD kodar Azure AI Video Indexer den med en upplösning på 1 280 x 720. Annars kodas den som 640 x 468.
Ingen direktuppspelning: Insikter genereras men ingen strömningsåtgärd utförs och videon är inte tillgänglig på Webbplatsen för Azure AI Video Indexer. När Ingen direktuppspelning har valts debiteras du inte för kodning.

Exkludera modeller

Du kan exkludera modeller när du indexerar via både VI-webbplatsen och API:et. När du laddar upp en video för att indexera med hjälp av webbplatsen väljer du Avancerade inställningar>Indexeringsförinställningar och väljer sedan de AI-modeller som ska undantas från indexeringsresultatet. Detta kan möjliggöra effektivare indexering och VI-resultat som bara innehåller de insikter som du är intresserad av.

Anpassa innehållsmodeller

Med Azure AI Video Indexer kan du anpassa vissa av dess modeller så att de anpassas efter ditt specifika användningsfall. Dessa modeller omfattar varumärken, språk, person och tal.

Insikter och medielagring

Insight Storage

Alla indexinsikter och metadata sparas i lagringskonton som hanteras av VI och du debiteras inte för den här lagringen.

Medielagring

Ditt VI-konto är anslutet till ett Azure Storage-konto. Du styr och betalar för användningen av det här lagringskontot. Följande filer lagras i det här kontot när en video indexeras:

Källfilen. Den behålls om du vill indexera om videon i framtiden.
En ny kodad fil när strömningskvaliteten är inställd på enkel bithastighet.

Ta bort media

Indexerade medier och alla dess associerade filer och insikter kan tas bort på tre sätt:

Ta bort filerna med Video Indexer-portalen.
Använd begäran ta bort video eller ta bort videokälla.
Om du inte behöver lagra den ursprungliga mediefilen anger du parametern mellan 1 och 7 när du använder API:et retentionPeriod . Den indexerade videon och allt som är relaterat till den, källfilen, insikter osv. tas bort 1–7 dagar efter indexeringen.

Dela via