Sdílet prostřednictvím


Podpora jazyků a oblastí pro službu LUIS

Důležité

Služba LUIS bude vyřazena 1. října 2025 a od 1. dubna 2023 nebudete moct vytvářet nové prostředky LUIS. Doporučujeme migrovat aplikace LUIS do porozumění konverzačnímu jazyku, abyste mohli využívat další podporu produktů a vícejazyčné funkce.

Služba LUIS obsahuje celou řadu funkcí. Ne všechny funkce jsou dostupné ve stejných jazycích. Ujistěte se, že funkce, o které máte zájem, jsou podporované v jazykové verzi, na kterou cílíte. Aplikace LUIS je specifická pro jazykovou verzi a po nastavení ji nelze změnit.

Vícejazyčné aplikace LUIS

Pokud potřebujete vícejazyčnou klientskou aplikaci LUIS, jako je chatovací robot, máte několik možností. Pokud luis podporuje všechny jazyky, vyvíjíte aplikaci LUIS pro každý jazyk. Každá aplikace LUIS má jedinečné ID aplikace a protokol koncových bodů. Pokud potřebujete poskytnout porozumění jazyku pro jazyk, služba LUIS nepodporuje, můžete pomocí služby Translator přeložit promluvu do podporovaného jazyka, odeslat promluvu do koncového bodu služby LUIS a získat výsledné skóre.

Poznámka:

Novější verze funkcí Language Understanding je teď dostupná jako součást jazyka Azure AI. Další informace najdete v dokumentaci k jazyku Azure AI. Možnosti porozumění jazyku, které podporují více jazyků v rámci jazykové služby, najdete v tématu Konverzační language Understanding.

Podporované jazyky

Služba LUIS rozumí promluvám v následujících jazycích:

Jazyk Národní prostředí Předem připravená doména Předem připravená entita Doporučení seznamu frází **Analýza mínění a extrakce klíčových frází
Arabština (Preview – moderní standardní arabština) ar-AR - - - -
*Čínština zh-CN -
Nizozemština nl-NL - -
Angličtina (Spojené státy) en-US
Angličtina (Velká Británie) en-GB
Francouzština (Kanada) fr-CA - - -
francouzština (Francie) fr-FR
Němčina de-DE
Gujarati (Preview) gu-IN - - - -
Hindština (Preview) hi-IN - - -
Italština it-IT
*japonština ja-JP Pouze klíčová fráze
Korejština ko-KR - - Pouze klíčová fráze
Marathi (Preview) mr-IN - - - -
Portugalština (Brazílie) pt-BR ne všechny dílčí jazykové verze
Španělština (Mexiko) es-MX -
španělština (Španělsko). es-ES
Tamilština (Preview) ta-IN - - - -
Telugu (Preview) te-IN - - - -
Turečtina tr-TR - Pouze mínění

Podpora jazyků se liší u předem připravených entit a předem připravených domén.

*Poznámky k podpoře čínštiny

*Japonské poznámky k podpoře

  • Protože luis neposkytuje syntaktickou analýzu a nerozumějí rozdílu mezi Keigo a neformální japonštinou, musíte začlenit různé úrovně formalit jako příklady školení pro vaše aplikace.
    • でございます není totéž jako です.
    • です není totéž jako だ.

**Poznámky k podpoře jazykové služby

Služba Language zahrnuje předem připravenou entitu keyPhrase a analýzu mínění. Pouze portugalština je podporována pro subcultures: pt-PT a pt-BR. Všechny ostatní jazykové verze jsou podporovány na úrovni primární jazykové verze.

Podporované jazyky rozhraní Speech API

Viz jazyky podporované službou Speech pro jazyky režimu diktování řeči.

Podporované jazyky kontroly pravopisu Bingu

Seznam podporovaných jazyků a stavů najdete v tématu Podporované jazyky kontroly pravopisu Bingu.

Vzácná nebo cizí slova v aplikaci

V jazykové verzi en-us se luis učí rozlišovat většinu anglických slov, včetně slangu. V jazykové verzi zh-cn se služba LUIS učí rozlišovat většinu čínských znaků. Pokud používáte vzácné slovo ve en-us slově nebo znak a zh-cnvidíte, že služba LUIS zdá se, že ho nedokáže rozlišit, můžete toto slovo nebo znak přidat do funkce seznamu frází. Například slova mimo jazykovou verzi aplikace – to znamená cizí slova – by se měla přidat do funkce seznamu frází.

Hybridní jazyky

Hybridní jazyky kombinují slova ze dvou jazykových verzí, jako je angličtina a čínština. Tyto jazyky nejsou ve službě LUIS podporované, protože aplikace je založená na jedné jazykové verzi.

Tokenizace

Aby služba LUIS prováděla strojové učení, rozdělí promluvu na tokeny založené na jazykové verzi.

Jazyk každé mezery nebo speciální znak úroveň znaků složená slova
Arabština
Čínština
Nizozemština
Angličtina (en-us)
Angličtina (en-GB)
Francouzština (fr-FR)
Francouzština (fr-CA)
Němčina
Gudžarátština
Hindština
Italština
Japonština
Korejština
Maráthština
Portugalština (Brazílie)
Španělština (es-ES)
Španělština (es-MX)
Tamilština
Telugština
Turečtina

Vlastní verze tokenizátoru

Následující jazykové verze mají vlastní verze tokenizátoru:

Kultura Verze Účel
Němčina
de-de
1.0.0 Tokenizuje slova rozdělením pomocí tokenizátoru založeného na strojovém učení, který se pokusí rozdělit složená slova do jejich jednotlivých komponent.
Pokud uživatel zadá Ich fahre einen krankenwagen jako promluvu, je otočný na Ich fahre einen kranken wagen. Umožňuje označení kranken různých entit a wagen nezávisle na sobě.
Němčina
de-de
1.0.2 Tokenizuje slova rozdělením na mezery.
Pokud uživatel zadá Ich fahre einen krankenwagen jako promluvu, zůstane jediným tokenem. Proto krankenwagen je označen jako jedna entita.
Nizozemština
nl-nl
1.0.0 Tokenizuje slova rozdělením pomocí tokenizátoru založeného na strojovém učení, který se pokusí rozdělit složená slova do jejich jednotlivých komponent.
Pokud uživatel zadá Ik ga naar de kleuterschool jako promluvu, je otočný na Ik ga naar de kleuter school. Umožňuje označení kleuter různých entit a school nezávisle na sobě.
Nizozemština
nl-nl
1.0.1 Tokenizuje slova rozdělením na mezery.
Pokud uživatel zadá Ik ga naar de kleuterschool jako promluvu, zůstane jediným tokenem. Proto kleuterschool je označen jako jedna entita.

Migrace mezi verzemi tokenizátoru

Tokenizace probíhá na úrovni aplikace. Pro tokenizaci na úrovni verze neexistuje žádná podpora.

Importujte soubor jako novou aplikaci místo verze. Tato akce znamená, že nová aplikace má jiné ID aplikace, ale používá verzi tokenizátoru zadanou v souboru.