Projets multilingues
Compréhension du langage courant vous permet d’étendre facilement votre projet à plusieurs langues en même temps. Quand vous activez plusieurs langues dans des projets, vous pouvez ajouter à votre projet des énoncés et des synonymes spécifiques aux langues. Vous pouvez obtenir des prédictions multilingues pour vos intentions et vos entités.
Composants des intentions et des entités apprises multilingues
Quand vous activez plusieurs langues dans un projet, vous pouvez entraîner le projet principalement dans une langue et obtenir immédiatement des prédictions dans d’autres langues.
Par exemple, vous pouvez entraîner votre projet entièrement avec des énoncés en anglais, et l’interroger en français, en allemand, en mandarin, en japonais, en coréen et dans d’autres langues. Compréhension du langage courant vous permet de mettre facilement à l’échelle vos projets en plusieurs langues en utilisant la technologie multilingue pour entraîner vos modèles.
Quand vous déterminez qu’une langue particulière ne fonctionne pas aussi bien que les autres langues, vous pouvez ajouter des énoncés pour cette langue dans votre projet. Dans la page Étiqueter des énoncés de Language Studio, vous pouvez sélectionner la langue de l’énoncé que vous ajoutez. Quand vous introduisez des exemples pour cette langue dans le modèle, il découvre davantage la syntaxe de cette langue et apprend à mieux la prédire.
Vous ne devez pas nécessairement ajouter le même nombre d’énoncés pour chaque langue. Vous devez créer la majeure partie de votre projet dans une seule langue et ajouter seulement quelques énoncés dans les langues dont vous constatez qu’elles ne fonctionnent pas bien. Si vous créez un projet qui est principalement en anglais et que vous commencez à le tester en français, en allemand et en espagnol, vous pouvez par exemple constater que l’allemand ne fonctionne pas aussi bien que les deux autres langues. Dans ce cas, envisagez d’ajouter 5 % de vos exemples anglais d’origine en allemand, d’entraîner un nouveau modèle et de retester l’allemand. Vous devez normalement obtenir de meilleurs résultats pour les requêtes en allemand. Plus vous ajoutez d’énoncés, plus les résultats sont susceptibles d’être améliorés.
Quand vous ajoutez des données dans une autre langue, vous ne devez pas redouter qu’elles aient une incidence négative sur les autres langues.
Composants de liste et composants prédéfinis dans plusieurs langues
Les projets pour lesquels plusieurs langues sont activées vous permettent de spécifier des synonymes par langue pour chaque clé de la liste. Selon la langue avec laquelle vous interrogez votre projet, vous obtenez des correspondances seulement pour le composant de la liste avec des synonymes de cette langue. Quand vous interrogez votre projet, vous pouvez spécifier la langue dans le corps de la demande :
"query": "{query}"
"language": "{language code}"
Si vous ne fournissez pas une langue, c’est la langue par défaut de votre projet qui est utilisée. Pour obtenir la liste des différents codes de langue, consultez Prise en charge des langues.
Les composants prédéfinis sont similaires, où vous devez vous attendre à obtenir des prédictions pour les composants prédéfinis qui sont disponibles dans des langues spécifiques. La langue de la demande détermine ici aussi les composants qui tentent d’être prédits. Pour plus d’informations sur la prise en charge des langues de chaque composant prédéfini, consultez les composants d’entité prédéfinis pris en charge.