Språkstöd i Azure AI Video Indexer
I den här artikeln beskrivs språkalternativen för Video Indexer och en lista över språkstöd för var och en. Den innehåller språkstöd för Video Indexer-funktioner, översättning, språkidentifiering, anpassning och språkinställningar för Video Indexer-webbplatsen.
Språk som stöds per scenario
I det här avsnittet beskrivs språkalternativen för Video Indexer och en tabell med de språk som stöds för var och en.
Viktigt!
Alla språk som anges stöder översättning vid indexering via API:et.
Kolumnförklaringar
Källspråk som stöds – det språk som talas i mediefilen som stöds för transkription, översättning och sökning.
Språkidentifiering – Om språket kan identifieras automatiskt av Video Indexer när språkidentifiering används för indexering. Mer information finns i Använda Azure AI Video Indexer för att identifiera talade språk automatiskt och avsnittet Språkidentifiering .
Anpassning (språkmodell) – Om språket kan användas vid anpassning av språkmodeller i Video Indexer. Mer information finns i Anpassa en språkmodell i Azure AI Video Indexer.
Uttal (språkmodell) – Om språket kan användas för att skapa en uttalsdatauppsättning som en del av en anpassad talmodell. Mer information finns i Anpassa en talmodell med Azure AI Video Indexer.
Webbplatsöversättning – Om språket stöds för översättning när du använder Azure AI Video Indexer-webbplatsen. Välj det översatta språket i den nedrullningsbara menyn för språk.
Följande insikter översätts:
- Avskrift
- Nyckelord
- Ämnen
- Etiketter
- Rammönster (endast till hebreiska från och med nu)
Alla andra insikter visas på engelska när du använder översättning.
Webbplatsspråk – Om språket kan väljas för användning på Webbplatsen för Azure AI Video Indexer. Välj ikonen Inställningar och välj sedan språket i listrutan Språkinställningar.
Språk | Code | Stödd källspråk |
Språk identifikation |
Kundanpassning (språkmodell) |
Uttal (språkmodell) |
Webbplats Översättning |
Webbplats Språk |
---|---|---|---|---|---|---|---|
Afrikaans | af-ZA | ✔ | |||||
Arabiska (Israel) | ar-IL | ✔ | ✔ | ||||
Arabiska (Irak) | ar-IQ | ✔ | ✔ | ||||
Arabiska (Jordanien) | ar-JO | ✔ | ✔ | ✔ | |||
Arabiska (Kuwait) | ar-KW | ✔ | ✔ | ✔ | |||
Arabiska (Libanon) | ar-LB | ✔ | ✔ | ||||
Arabiska (Oman) | ar-OM | ✔ | ✔ | ✔ | |||
Arabiska (palestinska myndigheten) | ar-PS | ✔ | ✔ | ||||
Arabiska (Qatar) | ar-QA | ✔ | ✔ | ✔ | |||
Arabiska (Saudiarabien) | ar-SA | ✔ | ✔ | ✔ | |||
Arabiska (Förenade Arabemiraten) | ar-AE | ✔ | ✔ | ✔ | |||
Arabiska Egypten | ar-EG | ✔ | ✔ | ✔ | ✔ | ||
Arabisk modern standard (Bahrain) | ar-BH | ✔ | ✔ | ✔ | |||
Arabiska Arabrepubliken Syrien | ar-SY | ✔ | ✔ | ✔ | |||
Armeniska | hy-AM | ✔ | |||||
Bangla | bn-BD | ✔ | |||||
Bosnian | bs-Latn | ✔ | |||||
Bulgariska | bg-BG | ✔ | ✔ | ✔ | |||
Katalanska | ca-ES | ✔ | ✔ | ✔ | ✔ | ✔ | |
Kinesiska (kantonesiska traditionella) | zh-HK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Kinesiska (förenklad) | zh-Hans | ✔ | ✔ | ✔ | ✔ | ||
Kinesiska (förenklad) | zh-CK | ✔ | ✔ | ✔ | ✔ | ||
Kinesiska (traditionell) | zh-Hant | ✔ | |||||
Kroatiska | hr-HR | ✔ | ✔ | ✔ | ✔ | ||
Tjeckiska | cs-CZ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Danska | da-DK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Nederländska | nl-NL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Engelska Australien | en-AU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Engelska Storbritannien | en-GB | ✔ | ✔ | ✔ | ✔ | ✔ | |
Engelska USA | en-US | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Estniska | et-EE | ✔ | ✔ | ✔ | ✔ | ✔ | |
Fijianska | en-FJ | ✔ | |||||
Filipino | fil-PH | ✔ | |||||
Finska | fi-FI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Franska | fr-FR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Franska (Kanada) | fr-CA | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Tyska | de-DE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Grekiska | el-GR | ✔ | ✔ | ✔ | |||
Gujarati | gu-IN | ✔ | ✔ | ✔ | |||
Haitisk | fr-HT | ✔ | |||||
Hebreiska | he-IL | ✔ | ✔ | ✔ | ✔ | ||
Hindi | hi-IN | ✔ | ✔ | ✔ | ✔ | ✔ | |
Ungerska | hu-HU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Isländska | is-IS | ✔ | |||||
Indonesiska | id-ID | ✔ | ✔ | ✔ | |||
Iriska | ga-IE | ✔ | ✔ | ✔ | ✔ | ||
Italienska | it-IT | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Japanska | ja-JP | ✔ | ✔ | ✔ | ✔ | ✔ | |
Kannada | kn-IN | ✔ | ✔ | ||||
Kiswahili | sw-KE | ✔ | |||||
Koreanska | ko-KR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Lettiska | lv-LV | ✔ | ✔ | ✔ | ✔ | ✔ | |
Litauiska | lt-LT | ✔ | ✔ | ✔ | |||
Malagassiska | mg-MG | ✔ | |||||
Malajiska | ms-MY | ✔ | ✔ | ||||
Malayalam | ml-IN | ✔ | ✔ | ||||
Maltesiska | mt-MT | ✔ | |||||
Norska | nb-NO | ✔ | ✔ | ✔ | ✔ | ||
Persiska | fa-IR | ✔ | ✔ | ✔ | |||
Polska | pl-PL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Portugisiska | pt-BR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Portugisiska (Portugal) | pt-PT | ✔ | ✔ | ✔ | ✔ | ✔ | |
Rumänska | ro-RO | ✔ | ✔ | ✔ | ✔ | ✔ | |
Ryska | ru-RU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Samoanska | en-WS | ||||||
Serbiska (kyrillisk) | sr-Cyrl-RS | ✔ | |||||
Serbiska (latinsk) (Serbien) | sr-Latn-RS | ✔ | |||||
Slovakiska | sk-SK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Slovenska | sl-SI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Spanska | es-ES | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Spanska (Mexiko) | es-MX | ✔ | ✔ | ✔ | ✔ | ✔ | |
Svenska | sv-SE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Tamilska | ta-IN | ✔ | ✔ | ✔ | |||
Telugu | te-IN | ✔ | ✔ | ||||
Thailändska | th-TH | ✔ | ✔ | ✔ | ✔ | ||
Tonga | till to-TO | ✔ | |||||
Turkiska | tr-TR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Ukrainska | uk-UA | ✔ | ✔ | ✔ | |||
Urdu | your-PK | ✔ | |||||
Vietnamesiska | vi-VN | ✔ | ✔ | ✔ |
Hämta språk som stöds via API:et
Använd API-anropet Hämta språk som stöds för att hämta en fullständig lista över språk som stöds per område. Mer information finns i Hämta språk som stöds.
API:et returnerar en lista över språk som stöds med följande värden:
{
"name": "Language",
"languageCode": "Code",
"isRightToLeft": true/false,
"isSourceLanguage": true/false,
"isAutoDetect": true/false
}
Källspråk som stöds:
Om
isSourceLanguage
är falskt stöds språket endast för översättning. OmisSourceLanguage
är sant stöds språket som källa för transkription, översättning och sökning.Språkidentifiering (automatisk identifiering):
Om
isAutoDetect
är sant stöds språket för språkidentifiering (LID) och multispråksidentifiering (MLID).
Språkidentifiering
När du laddar upp en mediefil till Video Indexer kan du ange mediefilens källspråk. Om du indexerar en fil via Video Indexer-webbplatsen kan du göra detta genom att välja ett språk under filuppladdningen. Om du skickar indexeringsjobbet via API:et görs det med hjälp av språkparametern. Det valda språket används sedan för att generera transkriptionen av filen.
Om du inte är säker på mediefilens källspråk eller om det kan innehålla flera språk kan Video Indexer identifiera de talade språken. Om du väljer antingen Autoidentifiering av ett enda språk (LID) eller flera språk (MLID) för mediefilens källspråk används det identifierade språket eller språken för att transkribera mediefilen. Mer information om LID och MLID finns i Använda Azure AI Video Indexer för att identifiera talade språk automatiskt, se Identifiera det talade språket automatiskt med språkidentifieringsmodellen och Identifiera och transkribera innehåll på flera språk automatiskt
Det finns en gräns på 10 språk som tillåts för identifiering under indexeringen av en mediefil för både LID och MLID. Följande är de 9 standardspråken för språkidentifiering (LID) och multispråksidentifiering (MILD):
- Tyska (de-DE)
- Engelska USA (en-US)
- Spanska (es-ES)
- Franska (fr-FR)
- Italienska (it-IT)
- Japanska (ja-JP)
- Portugisiska (pt-BR)
- Ryska (ru-RU)
- Kinesiska (förenklad) (zh-Hans)
Så här ändrar du listan över standardspråk
Om du behöver använda språk för identifiering som inte används som standard kan du anpassa listan till 10 språk som stöder anpassning via webbplatsen eller API:et:
Använd webbplatsen för att ändra listan
Välj fliken Språk-ID under Modellanpassning. Listan över språk är specifik för det Video Indexer-konto som du använder och för den inloggade användaren. Standardlistan över språk sparas per användare på deras lokala enhet, per enhet och webbläsare. Därför kan varje användare konfigurera sin egen standardlista för identifierade språk.
Använd Lägg till språk för att söka efter och lägga till fler språk. Om 10 språk redan har valts måste du först ta bort ett av de befintliga identifierade språken innan du lägger till ett nytt.
Använd API:et för att ändra listan
När du laddar upp en fil korsreferenser 9 språk i Video Indexer-språkmodellen som standard. Om det finns en matchning genererar modellen transkriptionen för filen med det identifierade språket.
Använd språkparametern för att ange multi
parametrar (MLID) eller auto
(LID). Använd parametern customLanguages
för att ange upp till 10 språk. (Parametern används endast när språkparametern är inställd på multi
eller auto
.) Mer information om hur du använder API :et finns i Använda Azure AI Video Indexer API.