Suporte a idiomas no Azure AI Video Indexer
Este artigo explica as opções de idioma do Video Indexer e fornece uma lista de suporte a idiomas para cada uma delas. Ele inclui o suporte a idiomas para recursos do Video Indexer, tradução, identificação de idioma, personalização e as configurações de idioma do site Video Indexer.
Idiomas suportados por cenário
Esta seção explica as opções de idioma do Video Indexer e tem uma tabela dos idiomas suportados para cada um.
Importante
Todos os idiomas listados suportam tradução ao indexar através da API.
Explicações da coluna
Idioma de origem suportado – O idioma falado no arquivo de mídia suportado para transcrição, tradução e pesquisa.
Identificação de idioma - Se o idioma pode ser detetado automaticamente pelo Video Indexer quando a identificação de idioma é usada para indexação. Para saber mais, consulte Usar o Indexador de Vídeo do Azure AI para identificar automaticamente idiomas falados e a seção Identificação de Idioma .
Personalização (modelo de linguagem) - Se a linguagem pode ser usada ao personalizar modelos de linguagem no Video Indexer. Para saber mais, consulte Personalizar um modelo de linguagem no Azure AI Video Indexer.
Pronúncia (modelo de linguagem) - Se o idioma pode ser usado para criar um conjunto de dados de pronúncia como parte de um modelo de fala personalizado. Para saber mais, consulte Personalizar um modelo de fala com o Azure AI Video Indexer.
Tradução de Sites – Se o idioma tem suporte para tradução ao usar o site do Azure AI Video Indexer. Selecione o idioma traduzido no menu suspenso de idioma.
Os seguintes insights são traduzidos:
- Transcrição
- Palavras-chave
- Tópicos
- Etiquetas
- Padrões de quadros (Apenas para hebraico a partir de agora)
Todos os outros insights aparecem em inglês ao usar a tradução.
Idioma do site - Se o idioma pode ser selecionado para uso no site do Azure AI Video Indexer. Selecione o ícone Configurações e, em seguida, selecione o idioma na lista suspensa Configurações de idioma.
Idioma | Código |
Suportado língua de partida |
Idioma identificação |
Personalização (modelo linguístico) |
Pronúncia (modelo linguístico) |
Sítio Web Tradução |
Sítio Web Idioma |
---|---|---|---|---|---|---|---|
Afrikaans | af-ZA | ✔ | |||||
Árabe (Israel) | ar-IL | ✔ | ✔ | ||||
Árabe (Iraque) | ar-QI | ✔ | ✔ | ||||
Árabe (Jordânia) | ar-JO | ✔ | ✔ | ✔ | |||
Árabe (Kuwait) | ar-KW | ✔ | ✔ | ✔ | |||
Árabe (Líbano) | ar-LB | ✔ | ✔ | ||||
Árabe (Omã) | ar-OM | ✔ | ✔ | ✔ | |||
Árabe (Autoridade Palestiniana) | ar-PS | ✔ | ✔ | ||||
Árabe (Qatar) | ar-QA | ✔ | ✔ | ✔ | |||
Árabe (Arábia Saudita) | ar-SA | ✔ | ✔ | ✔ | |||
Árabe (Emirados Árabes Unidos) | ar-AE | ✔ | ✔ | ✔ | |||
Árabe Egito | ar-EG | ✔ | ✔ | ✔ | ✔ | ||
Padrão Árabe Moderno (Bahrein) | ar-BH | ✔ | ✔ | ✔ | |||
Árabe Síria República Árabe | ar-SY | ✔ | ✔ | ✔ | |||
Arménio | hy-AM | ✔ | |||||
Bangla | bn-BD | ✔ | |||||
Bósnio | bs-Latn | ✔ | |||||
Búlgaro | bg-BG | ✔ | ✔ | ✔ | |||
Catalão | ca-ES | ✔ | ✔ | ✔ | ✔ | ✔ | |
Chinês (Cantonês Tradicional) | zh-HK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Chinês (Simplificado) | zh-Hans | ✔ | ✔ | ✔ | ✔ | ||
Chinês (Simplificado) | zh-CK | ✔ | ✔ | ✔ | ✔ | ||
Chinês (Tradicional) | zh-Hant | ✔ | |||||
Croata | hr-HR | ✔ | ✔ | ✔ | ✔ | ||
Checo | cs-CZ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Dinamarquês | da-DK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Neerlandês | nl-NL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Português Portugal | en-AU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Português Reino Unido | en-GB | ✔ | ✔ | ✔ | ✔ | ✔ | |
Português Portugal | en-US | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Estónio | et-EE | ✔ | ✔ | ✔ | ✔ | ✔ | |
Fijiano | pt-FJ | ✔ | |||||
Filipino | fil-PH | ✔ | ✔ | ||||
Finlandês | fi-FI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Francês | fr-FR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Francês (Canadá) | fr-CA | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Alemão | de-DE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Grego | el-GR | ✔ | ✔ | ✔ | |||
Guzerate | Gu-IN | ✔ | ✔ | ✔ | |||
Haitiano | fr-HT | ✔ | |||||
Hebraico | he-IL | ✔ | ✔ | ✔ | ✔ | ||
Hindi | hi-IN | ✔ | ✔ | ✔ | ✔ | ✔ | |
Húngaro | hu-HU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Islandês | é-IS | ✔ | |||||
Indonésio | id-ID | ✔ | ✔ | ✔ | |||
Irlandês | ga-IE | ✔ | ✔ | ✔ | ✔ | ||
Italiano | it-IT | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Japonês | ja-JP | ✔ | ✔ | ✔ | ✔ | ✔ | |
Canarês | kn-IN | ✔ | ✔ | ||||
Kiswahili | sw-KE | ✔ | |||||
Coreano | ko-KR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Letão | lv-LV | ✔ | ✔ | ✔ | ✔ | ✔ | |
Lituano | lt-LT | ✔ | ✔ | ✔ | |||
Malgaxe | mg-MG | ✔ | |||||
Malaio | ms-MY | ✔ | ✔ | ||||
Malaiala | ml-IN | ✔ | ✔ | ||||
Maltês | MT-MT | ✔ | |||||
Norueguês | nb-NO | ✔ | ✔ | ✔ | ✔ | ||
Persa | fa-IR | ✔ | ✔ | ✔ | |||
Polaco | pl-PL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Português | pt-BR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Português (Portugal) | pt-PT | ✔ | ✔ | ✔ | ✔ | ✔ | |
Romeno | ro-RO | ✔ | ✔ | ✔ | ✔ | ✔ | |
Russo | ru-RU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Samoano | en-WS | ||||||
Sérvio (Cirílico) | sr-Cyrl-RS | ✔ | |||||
Sérvio (Latim) | sr-Latn-RS | ✔ | |||||
Eslovaco | sk-SK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Esloveno | sl-SI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Espanhol | es-ES | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Espanhol (México) | es-MX | ✔ | ✔ | ✔ | ✔ | ✔ | |
Sueco | sv-SE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Tâmil | ta-IN | ✔ | ✔ | ✔ | |||
Telugu | te-IN | ✔ | ✔ | ||||
Tailandês | th-TH | ✔ | ✔ | ✔ | ✔ | ||
Tonga | para-TO | ✔ | |||||
Turco | tr-TR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Ucraniano | uk-UA | ✔ | ✔ | ✔ | |||
Urdu | Ur-PK | ✔ | |||||
Vietnamita | vi-VN | ✔ | ✔ | ✔ |
Obtenha idiomas suportados através da API
Use a chamada da API Obter idiomas suportados para obter uma lista completa de idiomas suportados por área. Para obter mais informações, consulte Obter idiomas suportados.
A API retorna uma lista de idiomas suportados com os seguintes valores:
{
"name": "Language",
"languageCode": "Code",
"isRightToLeft": true/false,
"isSourceLanguage": true/false,
"isAutoDetect": true/false
}
Idioma de origem suportado:
Se
isSourceLanguage
for falso, o idioma é suportado apenas para tradução. SeisSourceLanguage
for verdadeiro, o idioma é suportado como fonte para transcrição, tradução e pesquisa.Identificação do idioma (deteção automática):
Se
isAutoDetect
for true, o idioma é suportado para identificação de idioma (LID) e identificação multilíngüe (MLID).
Identificação linguística
Ao carregar um arquivo de mídia para o Video Indexer, você pode especificar o idioma de origem do arquivo de mídia. Se indexar um arquivo através do site Video Indexer, isso pode ser feito selecionando um idioma durante o upload do arquivo. Se você estiver enviando o trabalho de indexação por meio da API, ele será feito usando o parâmetro language. O idioma selecionado é então usado para gerar a transcrição do arquivo.
Se você não tiver certeza do idioma de origem do arquivo de mídia ou se ele pode conter vários idiomas, o Video Indexer pode detetar os idiomas falados. Se você selecionar Auto-detect single language (LID) ou multi-language (MLID) para o idioma de origem do arquivo de mídia, o idioma ou idiomas detetados serão usados para transcrever o arquivo de mídia. Para saber mais sobre LID e MLID, consulte Usar o Azure AI Video Indexer para identificar automaticamente os idiomas falados, consulte Identificar automaticamente o idioma falado com o modelo de identificação de idioma e Identificar e transcrever automaticamente conteúdo multilíngüe
Há um limite de 10 idiomas permitidos para identificação durante a indexação de um arquivo de mídia para LID e MLID. A seguir estão os 9 idiomas padrão de identificação de idioma (LID) e identificação multilíngüe (MILD):
- Alemão (de-DE)
- Inglês Estados Unidos (en-US)
- Espanhol (es-ES)
- Francês (fr-FR)
- Italiano (it-IT)
- Japonês (ja-JP)
- Português (pt-BR)
- Russo (ru-RU)
- Chinês (simplificado) (zh-Hans)
Como alterar a lista de idiomas padrão
Se você precisar usar idiomas para identificação que não são usados por padrão, poderá personalizar a lista para quaisquer 10 idiomas que ofereçam suporte à personalização por meio do site ou da API:
Use o site para alterar a lista
Selecione a guia ID de idioma em Personalização do modelo. A lista de idiomas é específica para a conta do Video Indexer que você está usando e para o usuário conectado. A lista padrão de idiomas é salva por usuário em seu dispositivo local, por dispositivo e navegador. Como resultado, cada usuário pode configurar sua própria lista de idiomas identificados padrão.
Use Adicionar idioma para pesquisar e adicionar mais idiomas. Se 10 idiomas já estiverem selecionados, primeiro você deve remover um dos idiomas detetados existentes antes de adicionar um novo.
Usar a API para alterar a lista
Quando você carrega um arquivo, o modelo de idioma do Video Indexer faz referência cruzada a 9 idiomas por padrão. Se houver uma correspondência, o modelo gera a transcrição do arquivo com o idioma detetado.
Use o parâmetro language para especificar multi
parâmetros (MLID) ou auto
(LID). Use o customLanguages
parâmetro para especificar até 10 idiomas. (O parâmetro é usado somente quando o parâmetro language é definido como multi
ou auto
.) Para saber mais sobre como usar a API, consulte Usar a API do Azure AI Video Indexer.