Podpora jazyků a oblastí pro službu LUIS
Důležité
Služba LUIS bude vyřazena 1. října 2025 a od 1. dubna 2023 nebudete moct vytvářet nové prostředky LUIS. Doporučujeme migrovat aplikace LUIS do porozumění konverzačnímu jazyku, abyste mohli využívat další podporu produktů a vícejazyčné funkce.
Služba LUIS obsahuje celou řadu funkcí. Ne všechny funkce jsou dostupné ve stejných jazycích. Ujistěte se, že funkce, o které máte zájem, jsou podporované v jazykové verzi, na kterou cílíte. Aplikace LUIS je specifická pro jazykovou verzi a po nastavení ji nelze změnit.
Vícejazyčné aplikace LUIS
Pokud potřebujete vícejazyčnou klientskou aplikaci LUIS, jako je chatovací robot, máte několik možností. Pokud luis podporuje všechny jazyky, vyvíjíte aplikaci LUIS pro každý jazyk. Každá aplikace LUIS má jedinečné ID aplikace a protokol koncových bodů. Pokud potřebujete poskytnout porozumění jazyku pro jazyk, služba LUIS nepodporuje, můžete pomocí služby Translator přeložit promluvu do podporovaného jazyka, odeslat promluvu do koncového bodu služby LUIS a získat výsledné skóre.
Poznámka:
Novější verze funkcí Language Understanding je teď dostupná jako součást jazyka Azure AI. Další informace najdete v dokumentaci k jazyku Azure AI. Možnosti porozumění jazyku, které podporují více jazyků v rámci jazykové služby, najdete v tématu Konverzační language Understanding.
Podporované jazyky
Služba LUIS rozumí promluvám v následujících jazycích:
Jazyk | Národní prostředí | Předem připravená doména | Předem připravená entita | Doporučení seznamu frází | **Analýza mínění a extrakce klíčových frází |
---|---|---|---|---|---|
Arabština (Preview – moderní standardní arabština) | ar-AR |
- | - | - | - |
*Čínština | zh-CN |
✔ | ✔ | ✔ | - |
Nizozemština | nl-NL |
✔ | - | - | ✔ |
Angličtina (Spojené státy) | en-US |
✔ | ✔ | ✔ | ✔ |
Angličtina (Velká Británie) | en-GB |
✔ | ✔ | ✔ | ✔ |
Francouzština (Kanada) | fr-CA |
- | - | - | ✔ |
francouzština (Francie) | fr-FR |
✔ | ✔ | ✔ | ✔ |
Němčina | de-DE |
✔ | ✔ | ✔ | ✔ |
Gujarati (Preview) | gu-IN |
- | - | - | - |
Hindština (Preview) | hi-IN |
- | ✔ | - | - |
Italština | it-IT |
✔ | ✔ | ✔ | ✔ |
*japonština | ja-JP |
✔ | ✔ | ✔ | Pouze klíčová fráze |
Korejština | ko-KR |
✔ | - | - | Pouze klíčová fráze |
Marathi (Preview) | mr-IN |
- | - | - | - |
Portugalština (Brazílie) | pt-BR |
✔ | ✔ | ✔ | ne všechny dílčí jazykové verze |
Španělština (Mexiko) | es-MX |
- | ✔ | ✔ | ✔ |
španělština (Španělsko). | es-ES |
✔ | ✔ | ✔ | ✔ |
Tamilština (Preview) | ta-IN |
- | - | - | - |
Telugu (Preview) | te-IN |
- | - | - | - |
Turečtina | tr-TR |
✔ | ✔ | - | Pouze mínění |
Podpora jazyků se liší u předem připravených entit a předem připravených domén.
*Poznámky k podpoře čínštiny
- Služba LUIS v jazykové verzi
zh-CN
očekává zjednodušenou čínskou znakovou sadu místo tradiční znakové sady. - Názvy záměrů, entit, funkcí a regulárních výrazů můžou být v čínštině nebo římštině.
- Informace o tom, které předem připravené domény jsou podporované v jazykové verzi, najdete v
zh-CN
referenčních informacích k předem připraveným doménám.
*Japonské poznámky k podpoře
- Protože luis neposkytuje syntaktickou analýzu a nerozumějí rozdílu mezi Keigo a neformální japonštinou, musíte začlenit různé úrovně formalit jako příklady školení pro vaše aplikace.
- でございます není totéž jako です.
- です není totéž jako だ.
**Poznámky k podpoře jazykové služby
Služba Language zahrnuje předem připravenou entitu keyPhrase a analýzu mínění. Pouze portugalština je podporována pro subcultures: pt-PT
a pt-BR
. Všechny ostatní jazykové verze jsou podporovány na úrovni primární jazykové verze.
Podporované jazyky rozhraní Speech API
Viz jazyky podporované službou Speech pro jazyky režimu diktování řeči.
Podporované jazyky kontroly pravopisu Bingu
Seznam podporovaných jazyků a stavů najdete v tématu Podporované jazyky kontroly pravopisu Bingu.
Vzácná nebo cizí slova v aplikaci
V jazykové verzi en-us
se luis učí rozlišovat většinu anglických slov, včetně slangu. V jazykové verzi zh-cn
se služba LUIS učí rozlišovat většinu čínských znaků. Pokud používáte vzácné slovo ve en-us
slově nebo znak a zh-cn
vidíte, že služba LUIS zdá se, že ho nedokáže rozlišit, můžete toto slovo nebo znak přidat do funkce seznamu frází. Například slova mimo jazykovou verzi aplikace – to znamená cizí slova – by se měla přidat do funkce seznamu frází.
Hybridní jazyky
Hybridní jazyky kombinují slova ze dvou jazykových verzí, jako je angličtina a čínština. Tyto jazyky nejsou ve službě LUIS podporované, protože aplikace je založená na jedné jazykové verzi.
Tokenizace
Aby služba LUIS prováděla strojové učení, rozdělí promluvu na tokeny založené na jazykové verzi.
Jazyk | každé mezery nebo speciální znak | úroveň znaků | složená slova |
---|---|---|---|
Arabština | ✔ | ||
Čínština | ✔ | ||
Nizozemština | ✔ | ✔ | |
Angličtina (en-us) | ✔ | ||
Angličtina (en-GB) | ✔ | ||
Francouzština (fr-FR) | ✔ | ||
Francouzština (fr-CA) | ✔ | ||
Němčina | ✔ | ✔ | |
Gudžarátština | ✔ | ||
Hindština | ✔ | ||
Italština | ✔ | ||
Japonština | ✔ | ||
Korejština | ✔ | ||
Maráthština | ✔ | ||
Portugalština (Brazílie) | ✔ | ||
Španělština (es-ES) | ✔ | ||
Španělština (es-MX) | ✔ | ||
Tamilština | ✔ | ||
Telugština | ✔ | ||
Turečtina | ✔ |
Vlastní verze tokenizátoru
Následující jazykové verze mají vlastní verze tokenizátoru:
Kultura | Verze | Účel |
---|---|---|
Němčinade-de |
1.0.0 | Tokenizuje slova rozdělením pomocí tokenizátoru založeného na strojovém učení, který se pokusí rozdělit složená slova do jejich jednotlivých komponent. Pokud uživatel zadá Ich fahre einen krankenwagen jako promluvu, je otočný na Ich fahre einen kranken wagen . Umožňuje označení kranken různých entit a wagen nezávisle na sobě. |
Němčinade-de |
1.0.2 | Tokenizuje slova rozdělením na mezery. Pokud uživatel zadá Ich fahre einen krankenwagen jako promluvu, zůstane jediným tokenem. Proto krankenwagen je označen jako jedna entita. |
Nizozemštinanl-nl |
1.0.0 | Tokenizuje slova rozdělením pomocí tokenizátoru založeného na strojovém učení, který se pokusí rozdělit složená slova do jejich jednotlivých komponent. Pokud uživatel zadá Ik ga naar de kleuterschool jako promluvu, je otočný na Ik ga naar de kleuter school . Umožňuje označení kleuter různých entit a school nezávisle na sobě. |
Nizozemštinanl-nl |
1.0.1 | Tokenizuje slova rozdělením na mezery. Pokud uživatel zadá Ik ga naar de kleuterschool jako promluvu, zůstane jediným tokenem. Proto kleuterschool je označen jako jedna entita. |
Migrace mezi verzemi tokenizátoru
Tokenizace probíhá na úrovni aplikace. Pro tokenizaci na úrovni verze neexistuje žádná podpora.
Importujte soubor jako novou aplikaci místo verze. Tato akce znamená, že nová aplikace má jiné ID aplikace, ale používá verzi tokenizátoru zadanou v souboru.