Supporto delle lingue per la comprensione del linguaggio di conversazione
Leggere questo articolo per informazioni sulle lingue attualmente supportate da funzionalità CLU.
Opzione multilingue
Suggerimento
Per informazioni sulla modalità di training da usare per i progetti multilingue, vedere Come eseguire il training di un modello.
Con la comprensione della lingua di conversazione, è possibile eseguire il training di un modello in un linguaggio e usarla per stimare finalità ed entità da espressioni in un altro linguaggio. Questa funzionalità è efficiente, perché consente di risparmiare tempo e lavoro. Anziché compilare progetti separati per ogni lingua, è possibile gestire un set di dati multilingue in un unico progetto. Il set di dati non deve essere interamente nella stessa lingua, ma è necessario abilitare l'opzione multilingue per il progetto durante la creazione o successivamente nelle impostazioni del progetto. Se si nota che le prestazioni del modello sono scarse in determinate lingue durante il processo di valutazione, valutare l’aggiunta di altri dati in queste lingue al set di training.
È possibile eseguire il training del progetto con espressioni tutte in inglese ed eseguirne query in: francese, tedesco, mandarino, giapponese, coreano e altre lingue. La comprensione della lingua di conversazione semplifica la scalabilità dei progetti in diverse lingue grazie alla tecnologia multilingue per eseguire il training dei modelli.
Ogni volta che si rileva che le prestazioni per una determinata lingua non sono soddisfacenti come per altre lingue, è possibile aggiungere espressioni per tale lingua nel progetto. Nella pagina espressioni di tag in Language Studio è possibile selezionare la lingua dell'espressione che si sta aggiungendo. Quando si introducono esempi per tale lingua nel modello, si introducono più elementi di sintassi di tale lingua e le stime saranno migliori.
Non è previsto che si aggiunga lo stesso numero di espressioni per ogni lingua. È preferibile creare la maggior parte del progetto in un’unica lingua e aggiungere solo alcune espressioni nelle lingue le cui prestazioni sono insoddisfacenti. Se si crea un progetto principalmente in inglese e si inizia a testarlo in francese, tedesco e spagnolo, si potrebbe rilevare che le prestazioni per il tedesco non sono soddisfacenti come per le altre due lingue. In tal caso, valutare la possibilità di aggiungere il 5% degli esempi originali in inglese in tedesco, eseguire il training di un nuovo modello e ripetere i test per il tedesco. In tal modo, i risultati delle query in tedesco dovrebbero migliorare. Quanto maggiore è il numero di espressioni aggiunte, tanto più alte sono le probabilità di ottenere risultati migliori.
Quando si aggiungono dati in un'altra lingua, non è previsto un impatto negativo su altre lingue.
Elencare e creare componenti predefiniti in più lingue
I progetti con più lingue abilitate consentono di specificare sinonimi per ogni lingua per ogni chiave di elenco. A seconda della lingua con cui si esegue una query sul progetto, si otterranno corrispondenze solo per il componente elenco con sinonimi di tale lingua. Quando si esegue una query sul progetto, è possibile specificare la lingua nel corpo della richiesta:
"query": "{query}"
"language": "{language code}"
Se non si specifica una lingua, verrà selezionata la lingua predefinita del progetto.
I componenti predefiniti sono simili, perciò si dovrebbero ottenere stime per i componenti predefiniti disponibili in lingue specifiche. La lingua della richiesta determina di nuovo quali componenti si sta tentando di stimare.
Lingue supportate dalla comprensione del linguaggio di conversazione
La comprensione del linguaggio di conversazione supporta le espressioni nelle seguenti lingue:
Lingua | Codice lingua |
---|---|
Afrikaans | af |
Amharico | am |
arabo | ar |
Assamese | as |
Azero | az |
Bielorusso | be |
Bulgaro | bg |
Bengalese | bn |
Breton | br |
Bosniaco | bs |
Catalano | ca |
Ceco | cs |
Gallese | cy |
Danese | da |
Tedesco | de |
Greco | el |
Inglese (Stati Uniti) | en-us |
Inglese (Regno Unito) | en-gb |
Esperanto | eo |
Spagnolo | es |
Estone | et |
Basco | eu |
Persiano | fa |
Finlandese | fi |
Francese | fr |
Frisone occidentale | fy |
Irlandese | ga |
Scozzese Gaelico | gd |
Galiziano | gl |
Gujarati | gu |
Hausa | ha |
Ebraico | he |
Hindi | hi |
Croato | hr |
Ungherese | hu |
Armeno | hy |
Indonesiano | id |
Italiano | it |
Giapponese | ja |
Giavanese | jv |
Georgiano | ka |
Kazako | kk |
Khmer | km |
Kannada | kn |
Coreano | ko |
Curdo (Kurmanji) | ku |
Kirghiso | ky |
Latino | la |
Lao | lo |
Lituano | lt |
Lettone | lv |
Malgascio | mg |
Macedone | mk |
Malayalam | ml |
Mongolo | mn |
Marathi | mr |
Malese | ms |
Birmano | my |
Nepalese | ne |
Olandese | nl |
Norvegese (Bokmål) | nb |
Odia | or |
Punjabi | pa |
Polacco | pl |
Pashto | ps |
Portoghese (Brasile) | pt-br |
Portoghese (Portogallo) | pt-pt |
Romeno | ro |
Russo | ru |
Sanskrit | sa |
Sindhi | sd |
Sinhala | si |
Slovacco | sk |
Sloveno | sl |
Somalo | so |
Albanese | sq |
Serbo | sr |
Sundanese | su |
Svedese | sv |
Swahili | sw |
Tamil | ta |
Telugu | te |
Thai | th |
Pilipino | tl |
Turco | tr |
Uiguro | ug |
Ucraino | uk |
Urdu | ur |
Uzbeco | uz |
Vietnamita | vi |
Xhosa | xh |
Yiddish | yi |
Cinese semplificato | zh-hans |
Cinese tradizionale | zh-hant |
Zulu | zu |