Поддержка языка в Индексаторе видео в Azure AI
В этой статье описываются языковые параметры индексатора видео и приведен список поддержки языка для каждого из них. Он включает языки, поддерживаемые функциями Индексатора видео, переводом, идентификацией языка, настройкой и параметрами языка веб-сайта Индексатора видео.
Поддерживаемые языки для каждого сценария
В этом разделе описаны параметры языка индексатора видео и таблица поддерживаемых языков для каждого из них.
Внимание
Все языки, перечисленные в списке, поддерживают перевод при индексировании через API.
Объяснения столбцов
Поддерживаемый исходный язык — язык , который говорится в файле мультимедиа, поддерживаемый для транскрибирования, перевода и поиска.
Идентификация языка. Может ли язык автоматически обнаруживаться индексатором видео при использовании идентификации языка для индексирования. Дополнительные сведения см. в статье "Индексатор видео Azure AI" для автоматического идентификации языков и раздела "Идентификация языка".
Настройка (языковая модель) — можно ли использовать язык при настройке языковых моделей в Индексаторе видео. Дополнительные сведения см. в статье "Настройка языковой модели" в Индексаторе видео в Azure AI.
Произношение (языковая модель) — можно ли использовать язык для создания набора данных произношения в рамках пользовательской модели речи. Дополнительные сведения см. в статье "Настройка модели распознавания речи с помощью индексатора видео Azure AI".
Перевод веб-сайта. Поддерживается ли язык для перевода при использовании веб-сайта Индексатора видео Azure. Выберите переведенный язык в раскрывающемся меню языка.
Ниже приведены аналитические сведения.
- Запись
- Ключевые слова
- Разделы
- Наклейки
- Шаблоны кадров (в настоящее время только для иврита)
Все остальные аналитические сведения отображаются на английском языке при использовании перевода.
Язык веб-сайта. Можно ли выбрать язык для использования на веб-сайте Индексатора видео Azure. Щелкните значок "Параметры", а затем выберите язык в раскрывающемся списке "Параметры языка".
Язык | Код | Поддержанный исходный язык |
Язык идентификация |
Настройка (языковая модель) |
Произношение (языковая модель) |
Сайт Перевод |
Сайт Язык |
---|---|---|---|---|---|---|---|
Африкаанс | af-ZA | ✔ | |||||
Арабский (Израиль) | ar-IL | ✔ | ✔ | ||||
Арабский (Ирак) | ar-IQ | ✔ | ✔ | ||||
Арабский (Иордания) | ar-JO | ✔ | ✔ | ✔ | |||
Арабский (Кувейт) | ar-KW | ✔ | ✔ | ✔ | |||
Арабский (Ливан) | ar-LB | ✔ | ✔ | ||||
Арабский (Оман) | ar-OM | ✔ | ✔ | ✔ | |||
Арабский (Палестинская Автономия) | ar-PS | ✔ | ✔ | ||||
Арабский (Катар) | ar-QA | ✔ | ✔ | ✔ | |||
Арабский (Саудовская Аравия) | ar-SA | ✔ | ✔ | ✔ | |||
Дубай (Объединенные Арабские Эмираты) | ar-AE | ✔ | ✔ | ✔ | |||
Арабский (Египет) | ar-EG | ✔ | ✔ | ✔ | ✔ | ||
Арабский, современный стандартный (Бахрейн) | ar-BH | ✔ | ✔ | ✔ | |||
Арабский (Сирийская Арабская Республика) | ar-SY | ✔ | ✔ | ✔ | |||
Армянский | hy-AM | ✔ | |||||
Бенгальский | bn-BD | ✔ | |||||
Боснийский | bs-Latn | ✔ | |||||
Болгарский | bg-BG | ✔ | ✔ | ✔ | |||
Каталанский | ca-ES | ✔ | ✔ | ✔ | ✔ | ✔ | |
Китайский (кантонский, традиционное письмо) | zh-HK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Китайский (упрощенное письмо) | zh-Hans | ✔ | ✔ | ✔ | ✔ | ||
Китайский (упрощенное письмо) | zh-CK | ✔ | ✔ | ✔ | ✔ | ||
Китайский, традиционное письмо | zh-Hant | ✔ | |||||
Хорватский | hr-HR | ✔ | ✔ | ✔ | ✔ | ||
Чешский | cs-CZ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Датский | da-DK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Голландский | nl-NL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Английский (Австралия) | en-AU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Английский (Великобритания) | en-GB | ✔ | ✔ | ✔ | ✔ | ✔ | |
Английский (США) | en-US | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Эстонский | et-EE | ✔ | ✔ | ✔ | ✔ | ✔ | |
Фиджи | en-FJ | ✔ | |||||
Филиппинский | fil-PH | ✔ | |||||
Финский | fi-FI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Французский | fr-FR | ✔ | ✔ | ✔ | ✔ | ✔ | |
французский (Канада) | fr-CA | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Немецкий | de-DE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Греческий | el-GR | ✔ | ✔ | ✔ | |||
Гуджарати | gu-IN | ✔ | ✔ | ✔ | |||
Гаитянский | fr-HT | ✔ | |||||
Иврит | he-IL | ✔ | ✔ | ✔ | ✔ | ||
Хинди | hi-IN | ✔ | ✔ | ✔ | ✔ | ✔ | |
Венгерский | hu-HU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Исландский | is-IS | ✔ | |||||
Индонезийский | id-ID | ✔ | ✔ | ✔ | |||
Ирландский | ga-IE | ✔ | ✔ | ✔ | ✔ | ||
Итальянский | it-IT | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Японский | ja-JP | ✔ | ✔ | ✔ | ✔ | ✔ | |
Каннада | kn-IN | ✔ | ✔ | ||||
Суахили | sw-KE | ✔ | |||||
Корейский | ko-KR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Латышский | lv-LV | ✔ | ✔ | ✔ | ✔ | ✔ | |
Литовский | lt-LT | ✔ | ✔ | ✔ | |||
Малагасийский | mg-MG | ✔ | |||||
Малайский | ms-MY | ✔ | ✔ | ||||
Малаялам | ml-IN | ✔ | ✔ | ||||
Мальтийский | mt-MT | ✔ | |||||
Норвежский | nb-NO | ✔ | ✔ | ✔ | ✔ | ||
Персидский | fa-IR | ✔ | ✔ | ✔ | |||
Польский | pl-PL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Португальский | pt-BR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Португальский (Португалия) | pt-PT | ✔ | ✔ | ✔ | ✔ | ✔ | |
Румынский | ro-RO | ✔ | ✔ | ✔ | ✔ | ✔ | |
русский | ru-RU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Самоанский | en-WS | ||||||
Сербский (кириллица) | sr-Cyrl-RS | ✔ | |||||
Сербский (латиница) | sr-Latn-RS | ✔ | |||||
Словацкий | sk-SK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Словенский | sl-SI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Испанский | es-ES | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Испанский (Мексика) | es-MX | ✔ | ✔ | ✔ | ✔ | ✔ | |
Шведский | sv-SE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Тамильский | ta-IN | ✔ | ✔ | ✔ | |||
Телугу | te-IN | ✔ | ✔ | ||||
Тайский | th-TH | ✔ | ✔ | ✔ | ✔ | ||
Тонганский | to-TO | ✔ | |||||
Турецкий | tr-TR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Украинский | uk-UA | ✔ | ✔ | ✔ | |||
Урду | ur-PK | ✔ | |||||
Вьетнамский | vi-VN | ✔ | ✔ | ✔ |
Получение поддерживаемых языков через API
Используйте вызов API получения поддерживаемых языков для извлечения полного списка поддерживаемых языков в каждой области. Дополнительные сведения см. в разделе "Получение поддерживаемых языков".
API возвращает список поддерживаемых языков со следующими значениями:
{
"name": "Language",
"languageCode": "Code",
"isRightToLeft": true/false,
"isSourceLanguage": true/false,
"isAutoDetect": true/false
}
Поддерживаемый исходный язык:
Если
isSourceLanguage
значение равно false, язык поддерживается только для перевода. ЕслиisSourceLanguage
задано значение true, язык поддерживается в качестве источника для транскрибирования, перевода и поиска.Идентификация языка (автоматическое обнаружение):
Если
isAutoDetect
задано значение true, язык поддерживается для идентификации языка (LID) и многоязычной идентификации (MLID).
Идентификация языка
При отправке файла мультимедиа в Индексатор видео можно указать исходный язык файла мультимедиа. Если индексировать файл с помощью веб-сайта Индексатора видео, это можно сделать, выбрав язык во время отправки файла. Если вы отправляете задание индексирования через API, оно выполняется с помощью параметра языка. Затем выбранный язык используется для создания транскрибирования файла.
Если вы не уверены, что исходный язык файла мультимедиа или он может содержать несколько языков, Индексатор видео может обнаружить языки. Если для исходного языка файла мультимедиа выбрано автоматическое обнаружение одного языка (LID) или многоязычного языка (MLID), обнаруженный язык или языки будут использоваться для транскрибирования файла мультимедиа. Дополнительные сведения о LID и MLID см. в статье "Использование индексатора видео в Azure AI для автоматического идентификации языков", см. в статье "Автоматическое определение языка с помощью модели идентификации языка" и автоматическое определение и транскрибирование мультиязычного содержимого
Существует ограничение в 10 языков, разрешенных для идентификации во время индексирования файла мультимедиа для LID и MLID. Ниже приведены 9 языков идентификации языка (LID) и многоязычной идентификации (MILD):
- Немецкий (de-DE)
- Английский США (en-US)
- Испанский (es-ES)
- Французский (fr-FR)
- Итальянский (it-IT)
- Японский (ja-JP)
- Португальский (pt-BR)
- Русский (ru-RU)
- Китайский (упрощенное письмо) (zh-Hans)
Изменение списка языков по умолчанию
Если вам нужно использовать языки для идентификации, которые не используются по умолчанию, можно настроить список на любом из 10 языков, поддерживающих настройку с помощью веб-сайта или API:
Изменение списка с помощью веб-сайта
Выберите вкладку "Идентификатор языка" в разделе "Настройка модели". Список языков зависит от используемой учетной записи Индексатора видео и для пользователя, вошедшего в систему. Список языков по умолчанию сохраняется на пользователя на локальном устройстве, на каждом устройстве и браузере. В результате каждый пользователь может настроить собственный список языков, определенный по умолчанию.
Используйте добавление языка для поиска и добавления дополнительных языков. Если 10 языков уже выбраны, перед добавлением нового необходимо удалить один из существующих обнаруженных языков.
Изменение списка с помощью API
При отправке файла модель языка Индексатора видео перекрестно ссылается на 9 языков по умолчанию. При наличии совпадения модель создает транскрибирование для файла с обнаруженным языком.
Используйте параметр языка для указания multi
параметров (MLID) или auto
(LID). customLanguages
Используйте параметр, чтобы указать до 10 языков. (Параметр используется только в том случае, если для параметра языка задано multi
значение или auto
.) Дополнительные сведения об использовании API см. в статье "Использование API индексатора видео Azure ИИ".