Многоязычные проекты
Распознавание устной речи упрощает расширение проекта до нескольких языков. При включении нескольких языков в проектах вы можете добавлять речевые фрагменты и синонимы для конкретного языка в проект. Вы можете получить многоязычные прогнозы для намерений и сущностей.
Компоненты многоязычного намерения и изученных сущностей
При включении нескольких языков в проекте можно обучать проект главным образом на одном языке и сразу получать прогнозы на других языках.
Например, вы можете полностью обучать проект с речевыми фрагментами английского языка и запрашивать его на французском, немецком, мандарине, японском, корейском и других языках. Распознавание устной речи позволяет легко масштабировать проекты до нескольких языков, используя многоязычную технологию для обучения моделей.
Каждый раз, когда вы определяете, что конкретный язык не выполняется, а также другие языки, вы можете добавлять речевые фрагменты для этого языка в проекте. На странице Добавление тегов к речевым фрагментам в Language Studio вы можете выбрать язык добавляемого речевого фрагмента. При вводе примеров для этого языка в модель он вводится в большей части синтаксиса этого языка и учится прогнозировать его лучше.
Вам не нужно добавлять одинаковое количество речевых фрагментов для каждого языка. Вы должны создать большую часть проекта на одном языке и добавить только несколько речевых фрагментов на языках, которые вы наблюдаете, не работают хорошо. Если вы создаете проект, который в основном на английском языке и начинаете тестировать его на французском, немецком и испанском языках, вы можете наблюдать, что немецкий язык не выполняется, а также на двух других языках. В этом случае попробуйте добавить 5% исходных примеров английского языка на немецком языке, обучить новую модель и снова протестировать на немецком языке. Вы должны получить лучшие результаты для запросов на немецком языке. Чем больше речевых фрагментов вы добавите, тем больше вероятность того, что результаты станут лучше.
Когда вы добавляете данные на другом языке, не стоит опасаться, что они негативно повлияют на остальные языки.
Перечисление и предварительное создание компонентов на нескольких языках
Проекты с несколькими языками позволяют указать синонимы для каждого ключа списка. В зависимости от языка, с которым вы запрашиваете проект, вы получаете совпадения только для компонента списка с синонимами этого языка. При выполнении запроса проекта можно указать язык в тексте запроса.
"query": "{query}"
"language": "{language code}"
Если вы не предоставляете язык, он возвращается к языку по умолчанию проекта. Список различных языковых кодов см. в разделе "Поддержка языка".
Предварительно созданные компоненты аналогичны, и вы должны ожидать получения прогнозов для предварительно созданных компонентов, доступных на определенных языках. Язык запроса снова определяет, какие компоненты следует прогнозировать. Сведения о поддержке языка каждого предварительно созданного компонента см. в разделе "Поддерживаемые предварительно созданные компоненты сущностей".