Языковая поддержка анализа тональности и интеллектуального анализа мнений
В данной статье рассматривается, какие языки поддерживаются анализом тональности и интеллектуальным анализом мнений. Как облачные API, так и контейнеры Docker поддерживают одни и те же языки.
Языковая поддержка анализа тональности
Всего поддерживаемых языковых кодов: 94
Язык | Код языка | Примечания. |
---|---|---|
Африкаанс | af |
|
Албанский | sq |
|
Амхарский | am |
|
Арабский | ar |
|
Армянский | hy |
|
Ассамский | as |
|
Азербайджанский | az |
|
Баскский (Баскский) | eu |
|
Белорусский (новый) | be |
|
Бенгальский | bn |
|
Боснийский | bs |
|
Бретон (новое) | br |
|
Болгарский | bg |
|
Бирманский | my |
|
Каталанский | ca |
|
Китайский (упрощенное письмо) | zh-hans |
Также допускается zh |
Китайский, традиционное письмо | zh-hant |
|
Хорватский | hr |
|
Чешский | cs |
|
датский | da |
|
Голландский | nl |
|
Английский | en |
|
Esperanto (new) | eo |
|
Эстонский | et |
|
Филиппинский | fil |
|
Финский | fi |
|
французский | fr |
|
Галисийский | gl |
|
Грузинский | ka |
|
немецкий | de |
|
Греческий | el |
|
Гуджарати | gu |
|
Хауса (новая) | ha |
|
Иврит | he |
|
Хинди | hi |
|
Венгерский | hu |
|
Индонезийский | id |
|
Ирландский | ga |
|
Итальянский | it |
|
Японский | ja |
|
Javanese (новое) | jv |
|
Каннада | kn |
|
Казахский | kk |
|
Кхмерский | km |
|
Корейский | ko |
|
Курдский (Курманжи) | ku |
|
Киргизский | ky |
|
Лаосский | lo |
|
Латиница (новая) | la |
|
Латышский | lv |
|
Литовский | lt |
|
Macedonian | mk |
|
Малагасийский | mg |
|
Малайский | ms |
|
Малаялам | ml |
|
Маратхи | mr |
|
Монгольский | mn |
|
Непальский | ne |
|
Норвежский | no |
|
Ория | or |
|
Оромо (новое) | om |
|
Пушту | ps |
|
Персидский | fa |
|
Польский | pl |
|
Португальский (Португалия) | pt-PT |
Также допускается pt |
португальский (Бразилия) | pt-BR |
|
Панджаби | pa |
|
Румынский | ro |
|
Русский | ru |
|
Санскрит (новое) | sa |
|
Шотландский Гейлик (новое) | gd |
|
Сербский | sr |
|
Синдхи (новое) | sd |
|
Синхала (новая) | si |
|
Словацкий | sk |
|
Словенский | sl |
|
Сомалийский | so |
|
Испанский | es |
|
Sundanese (новое) | su |
|
Суахили | sw |
|
Шведский | sv |
|
Тамильский | ta |
|
Телугу | te |
|
Тайский | th |
|
Турецкий | tr |
|
Украинский | uk |
|
Урду | ur |
|
Уйгурский | ug |
|
Узбекский | uz |
|
Вьетнамский | vi |
|
Валлийский | cy |
|
Западный Фризиан (новое) | fy |
|
Xhosa (new) | xh |
|
Yiddish (new) | yi |
Языковая поддержка интеллектуального анализа мнений
Всего поддерживаемых языковых кодов: 94
Язык | Код языка | Примечания. |
---|---|---|
Afrikaans (new) | af |
|
Албанский (новый) | sq |
|
Амхарич (новое) | am |
|
Арабский | ar |
|
Армянский (новый) | hy |
|
Assamese (new) | as |
|
Азербайджан (новое) | az |
|
Баск (новая) | eu |
|
Белорусский (новый) | be |
|
Бенгальский | bn |
|
Боснийский (новый) | bs |
|
Бретон (новое) | br |
|
Болгарский (новый) | bg |
|
Бирмский (новый) | my |
|
Каталонский (новый) | ca |
|
Китайский (упрощенное письмо) | zh-hans |
Также допускается zh |
Китайский (традиционное) (новое) | zh-hant |
|
Хорватский (новый) | hr |
|
Чешская (новая) | cs |
|
датский | da |
|
Голландский | nl |
|
Английский | en |
|
Esperanto (new) | eo |
|
Эстония (новая) | et |
|
Филиппино (новое) | fil |
|
Финский | fi |
|
французский | fr |
|
Галицийский (новый) | gl |
|
Грузин (новое) | ka |
|
немецкий | de |
|
Греческий | el |
|
Гуджарати (новое) | gu |
|
Хауса (новая) | ha |
|
Иврит (новое) | he |
|
Хинди | hi |
|
Венгерский | hu |
|
Индонезийский | id |
|
Ирландский (новый) | ga |
|
Итальянский | it |
|
Японский | ja |
|
Javanese (новое) | jv |
|
Каннада (новая) | kn |
|
Казах (новое) | kk |
|
Кхмер (новая) | km |
|
Корейский | ko |
|
Курдский (Курманжи) | ku |
|
Киргиз (новое) | ky |
|
Лаос (новое) | lo |
|
Латиница (новая) | la |
|
Латышский (новый) | lv |
|
Литовец (новое) | lt |
|
Македонский (новый) | mk |
|
Малагаси (новое) | mg |
|
Малайский (новый) | ms |
|
Малаялам (новая) | ml |
|
Маратхи | mr |
|
Монгольский (новый) | mn |
|
Непали (новое) | ne |
|
Норвежский | no |
|
Одия (новая) | or |
|
Оромо (новое) | om |
|
Пашто (новое) | ps |
|
Персидский (новый) | fa |
|
Польский | pl |
|
Португальский (Португалия) | pt-PT |
Также допускается pt |
португальский (Бразилия) | pt-BR |
|
Пенджаби (новое) | pa |
|
Румын (новое) | ro |
|
русский | ru |
|
Санскрит (новое) | sa |
|
Шотландский Гейлик (новое) | gd |
|
Сербский (новый) | sr |
|
Синдхи (новое) | sd |
|
Синхала (новая) | si |
|
Словацкий (новый) | sk |
|
Словен (новое) | sl |
|
Сомалийский (новый) | so |
|
Испанский | es |
|
Sundanese (новое) | su |
|
Swahili (new) | sw |
|
Шведский | sv |
|
Тамильский | ta |
|
Телугу | te |
|
Тайский (новое) | th |
|
Турецкий | tr |
|
Украинский (новый) | uk |
|
Урду (новое) | ur |
|
Уйгур (новое) | ug |
|
Узбекистан (новое) | uz |
|
Вьетнамские (новые) | vi |
|
Валлийский (новый) | cy |
|
Западный Фризиан (новое) | fy |
|
Xhosa (new) | xh |
|
Yiddish (new) | yi |
Многоязычный параметр (только для анализа пользовательских тональности)
С помощью пользовательского анализа тональности можно обучить модель на одном языке и использовать для классификации документов на другом языке. Эта функция очень полезна, так как позволяет экономить время и усилия. Она устраняет необходимость создавать отдельные проекты для каждого языка, и в одном проекте можно использовать многоязычный набор данных. Набор данных не обязательно должен быть построен на одном языке, но при создании проекта или позже в параметрах проекта необходимо включить параметр многоязычности. Если при оценивании вы определили, что модель плохо работает на определенных языках, рассмотрите добавление дополнительных данных на таких языках в набор для обучения.
Вы можете полностью обучить свой проект документам на английском языке и запрашивать его на французском, немецком, китайском, японском, корейском и других языках. Пользовательский анализ тональности упрощает масштабирование проектов на нескольких языках с помощью многоязычной технологии для обучения моделей.
Когда вы обнаружите, что определенный язык работает не так хорошо, как другие языки, вы можете добавить документы для этого языка в свой проект.
Вы не должны добавлять одинаковое количество документов для каждого языка. Вы должны создать большую часть проекта на одном языке и добавить лишь несколько документов на тех языках, которые работают не очень хорошо. Если вы создадите проект преимущественно на английском языке и начнете тестировать его на французском, немецком и испанском языках, вы можете заметить, что немецкий язык работает не так хорошо, как два других языка. В этом случае попробуйте добавить 5 % исходных английских документов на немецком языке, обучите новую модель и снова протестируйте на немецком языке. Вы должны получить лучшие результаты для запросов на немецком языке. Чем больше документов с метками вы добавите, тем больше вероятность того, что результаты станут лучше.
Когда вы добавляете данные на другом языке, не стоит опасаться, что они негативно повлияют на остальные языки.
Следующие шаги
- Дополнительные сведения см. в разделе Способ вызова API.
- Краткое руководство. Использование клиентской библиотеки анализа тональности и REST API