Podpora jazyků pro porozumění konverzačnímu jazyku
V tomto článku se dozvíte o jazycích, které funkce CLU aktuálně podporuje.
Vícejazyčná možnost
Tip
Informace o tom, jaký režim trénování byste měli použít pro vícejazyčné projekty, najdete v tématu Postup trénování modelu .
Díky porozumění konverzačnímu jazyku můžete model trénovat v jednom jazyce a používat k predikci záměrů a entit z promluv v jiném jazyce. Tato funkce je výkonná, protože pomáhá ušetřit čas a úsilí. Místo vytváření samostatných projektů pro každý jazyk můžete zpracovávat vícejazyčnou datovou sadu v jednom projektu. Vaše datová sada nemusí být úplně ve stejném jazyce, ale při vytváření nebo pozdějším vytváření projektu byste měli povolit vícejazyčnou možnost pro váš projekt. Pokud si během procesu vyhodnocení všimnete, že váš model funguje špatně v určitých jazycích, zvažte přidání dalších dat v těchto jazycích do trénovací sady.
Projekt můžete vytrénovat zcela pomocí anglických promluv a dotazovat se na něj v: francouzštině, němčině, mandarínštině, japonštině, korejštině a dalších. Porozumění konverzačnímu jazyku usnadňuje škálování projektů na více jazyků pomocí vícejazyčné technologie pro trénování modelů.
Kdykoli zjistíte, že konkrétní jazyk nefunguje ani jiné jazyky, můžete v projektu přidat promluvy pro daný jazyk. Na stránce promluv značek v sadě Language Studio můžete vybrat jazyk přidávané promluvy. Když do modelu představíte příklady pro tento jazyk, seznámíte se s další syntaxí tohoto jazyka a naučíte se ho předpovědět lépe.
Neočekává se, že byste přidali stejný počet promluv pro každý jazyk. Většinu projektu byste měli sestavit v jednom jazyce a přidat jenom několik promluv v jazycích, které vidíte, nefungují dobře. Pokud vytvoříte projekt, který je primárně v angličtině, a začnete ho testovat ve francouzštině, němčině a španělštině, můžete vidět, že němčina nefunguje stejně jako ostatní dva jazyky. V takovém případě zvažte přidání 5 % původních příkladů v angličtině v němčině, vytrénování nového modelu a testování v němčině znovu. Měli byste vidět lepší výsledky pro německé dotazy. Čím víc promluv přidáte, tím pravděpodobnější budou výsledky lépe.
Když přidáváte data v jiném jazyce, neměli byste očekávat, že budou mít negativní vliv na jiné jazyky.
Výpis a předem připravené komponenty v několika jazycích
Projekty s povolenými více jazyky vám umožní zadat synonyma pro každý klíč seznamu. V závislosti na jazyce, pomocí kterého se dotazujete na projekt, získáte pouze shody pro součást seznamu se synonymy daného jazyka. Při dotazování projektu můžete v textu požadavku zadat jazyk:
"query": "{query}"
"language": "{language code}"
Pokud jazyk nezadáte, vrátí se do výchozího jazyka projektu.
Předem připravené komponenty jsou podobné, kde byste měli očekávat predikce pro předem připravené komponenty, které jsou k dispozici v konkrétních jazycích. Jazyk požadavku znovu určuje, které komponenty se pokoušejí předpovědět.
Jazyky podporované konverzačním jazykem
Porozumění konverzačnímu jazyku podporuje promluvy v následujících jazycích:
Jazyk | Kód jazyka |
---|---|
Afrikánština | af |
Amharština | am |
Arabština | ar |
Ásámština | as |
Ázerbájdžánština | az |
Běloruština | be |
Bulharština | bg |
Bengálština | bn |
Bretonština | br |
Bosenština | bs |
Katalánština | ca |
Čeština | cs |
Velština | cy |
Dánština | da |
Němčina | de |
Řečtina | el |
English (US) | en-us |
Angličtina (Velká Británie) | en-gb |
Esperanto | eo |
Španělština | es |
Estonština | et |
Baskičtina | eu |
Perština | fa |
Finština | fi |
Francouzština | fr |
Západní Frisian | fy |
Irština | ga |
Skotská gaelština | gd |
Galicijština | gl |
Gudžarátština | gu |
Hausa | ha |
Hebrejština | he |
Hindština | hi |
Chorvatština | hr |
Maďarština | hu |
Arménština | hy |
Indonéština | id |
Italština | it |
Japonština | ja |
Jávský | jv |
Gruzínština | ka |
Kazaština | kk |
Khmerština | km |
Kannadština | kn |
Korejština | ko |
Kurština (Kurmanji) | ku |
Kyrgyzština | ky |
Latina | la |
Laoština | lo |
Litevština | lt |
Lotyština | lv |
Malgaština | mg |
Makedonština | mk |
Malajalámština | ml |
Mongolština | mn |
Maráthština | mr |
Malajština | ms |
Barmština | my |
Nepálština | ne |
Nizozemština | nl |
Norština (Bokmal) | nb |
Udijština | or |
Paňdžábština | pa |
Polština | pl |
Pashto | ps |
Portugalština (Brazílie) | pt-br |
portugalština (Portugalsko) | pt-pt |
Rumunština | ro |
Ruština | ru |
Sanskrt | sa |
Sindhština | sd |
Sinhala | si |
Slovenština | sk |
Slovinština | sl |
Somálijsko | so |
Albánština | sq |
Srbština | sr |
Sundánština | su |
Švédština | sv |
Svahilština | sw |
Tamilština | ta |
Telugština | te |
Thajština | th |
Filipino | tl |
Turečtina | tr |
Ujgurština | ug |
Ukrajinština | uk |
Urdština | ur |
Uzbečtina | uz |
Vietnamština | vi |
Xhoština | xh |
Jidiš | yi |
Čínština (zjednodušená) | zh-hans |
Čínština (tradiční) | zh-hant |
Zulština | zu |