Språk- och regionstöd för LUIS

Artikel
09/01/2024

Viktigt!

LUIS dras tillbaka den 1 oktober 2025 och från och med den 1 april 2023 kommer du inte att kunna skapa nya LUIS-resurser. Vi rekommenderar att du migrerar dina LUIS-program till förståelse för konversationsspråk för att dra nytta av fortsatt produktsupport och flerspråkiga funktioner.

Det finns flera olika funktioner i tjänsten LUIS. Vilka funktioner som stöds varierar mellan olika språk. Kontrollera att de funktioner som du är intresserad av stöds i målspråkkulturen. En LUIS-app är kulturspecifik och kan inte ändras när den har angetts.

Flerspråkiga LUIS-appar

Om du behöver ett flerspråkigt LUIS-klientprogram, till exempel en chattrobot, har du några alternativ. Om LUIS stöder alla språk utvecklar du en LUIS-app för varje språk. Varje LUIS-app har ett unikt app-ID och en slutpunktslogg. Om du behöver tillhandahålla språktolkning för ett språk som LUIS inte stöder kan du använda Translator-tjänsten för att översätta yttrandet till ett språk som stöds, skicka yttrandet till LUIS-slutpunkten och ta emot resultatet.

Kommentar

En nyare version av Funktionerna i Language Understanding är nu tillgänglig som en del av Azure AI Language. Mer information finns i Dokumentation om Azure AI Language. Information om funktioner för språktolkning som stöder flera språk i språktjänsten finns i Konversationsspråkförstårelse.

Språk som stöds

LUIS förstår yttranden på följande språk:

Språk	Nationella inställningar	Fördefinierad domän	Fördefinierad entitet	Rekommendationer för fraslista	**Sentimentanalys och extrahering av nyckelfraser
Arabiska (förhandsversion – modern standard arabiska)	`ar-AR`	-	-	-	-
*Kinesiska	`zh-CN`	✔	✔	✔	-
Nederländska	`nl-NL`	✔	-	-	✔
Engelska (USA)	`en-US`	✔	✔	✔	✔
English (Storbritannien)	`en-GB`	✔	✔	✔	✔
Franska (Kanada)	`fr-CA`	-	-	-	✔
Franska (Frankrike)	`fr-FR`	✔	✔	✔	✔
Tyska	`de-DE`	✔	✔	✔	✔
Gujarati (förhandsversion)	`gu-IN`	-	-	-	-
Hindi (förhandsversion)	`hi-IN`	-	✔	-	-
Italienska	`it-IT`	✔	✔	✔	✔
*Japanska	`ja-JP`	✔	✔	✔	Endast nyckelfras
Koreanska	`ko-KR`	✔	-	-	Endast nyckelfras
Marathi (förhandsversion)	`mr-IN`	-	-	-	-
Portugisiska (Brasilien)	`pt-BR`	✔	✔	✔	inte alla underkulturer
Spanska (Mexiko)	`es-MX`	-	✔	✔	✔
Spanska (Spanien)	`es-ES`	✔	✔	✔	✔
Tamil (förhandsversion)	`ta-IN`	-	-	-	-
Telugu (förhandsversion)	`te-IN`	-	-	-	-
Turkiska	`tr-TR`	✔	✔	-	Endast sentiment

Språkstöd varierar för fördefinierade entiteter och fördefinierade domäner.

*Kinesiska supportanteckningar

zh-CN I kulturen förväntar sig LUIS den förenklade kinesiska teckenuppsättningen i stället för den traditionella teckenuppsättningen.
Namnen på avsikter, entiteter, funktioner och reguljära uttryck kan vara i kinesiska eller romerska tecken.
Se referensen för fördefinierade domäner för information om vilka fördefinierade domäner som stöds i zh-CN kulturen.

*Japanska supportanteckningar

Eftersom LUIS inte tillhandahåller syntaktisk analys och inte förstår skillnaden mellan Keigo och informell japanska, måste du införliva de olika formalitetsnivåerna som utbildningsexempel för dina program.
- でございます är inte samma som です.
- です är inte samma som だ.

**Supportanteckningar för språktjänsten

Språktjänsten innehåller keyPhrase-fördefinierad entitets- och attitydanalys. Endast portugisiska stöds för subkulturer: pt-PT och pt-BR. Alla andra kulturer stöds på den primära kulturnivån.

Språk som stöds av Speech API

Se Språk som stöds av tal för språk i taldikteringsläge.

Språk som stöds i stavningskontroll i Bing

En lista över språk och status som stöds finns i Språk som stöds i stavningskontroll i Bing.

Sällsynta eller främmande ord i ett program

en-us I kulturen lär sig LUIS att skilja de flesta engelska ord, inklusive slang. zh-cn I kulturen lär sig LUIS att skilja de flesta kinesiska tecken. Om du använder ett sällsynt ord i en-us eller tecken i zh-cn, och du ser att LUIS inte verkar kunna särskilja det ordet eller tecknet, kan du lägga till det ordet eller tecknet i en fraslista. Till exempel bör ord utanför programmets kultur , det vill säga främmande ord, läggas till i en fraslista.

Hybridspråk

Hybridspråk kombinerar ord från två kulturer som engelska och kinesiska. Dessa språk stöds inte i LUIS eftersom en app baseras på en enda kultur.

Tokenisering

För att utföra maskininlärning delar LUIS in ett yttrande i token baserat på kultur.

Språk	varje blanksteg eller specialtecken	teckennivå	sammansatta ord
Arabiska	✔
Kinesiska		✔
Nederländska	✔		✔
Engelska (en-us)	✔
Engelska (en-GB)	✔
Franska (fr-FR)	✔
Franska (fr-CA)	✔
Tyska	✔		✔
Gujarati	✔
Hindi	✔
Italienska	✔
Japanska			✔
Koreanska		✔
Marathi	✔
Portugisiska (Brasilien)	✔
Spanska (es-ES)	✔
Spanska (es-MX)	✔
Tamilska	✔
Telugu	✔
Turkiska	✔

Anpassade tokenizerversioner

Följande kulturer har anpassade tokenizer-versioner:

Kultur	Version	Syfte
Tyska `de-de`	1.0.0	Tokeniserar ord genom att dela upp dem med hjälp av en maskininlärningsbaserad tokeniserare som försöker dela upp sammansatta ord i sina enskilda komponenter. Om en användare anges som ett yttrande, omvandlas `Ich fahre einen krankenwagen` den till `Ich fahre einen kranken wagen`. Tillåta märkning av `kranken` och `wagen` oberoende som olika entiteter.
Tyska `de-de`	1.0.2	Tokeniserar ord genom att dela upp dem i blanksteg. Om en användare anges `Ich fahre einen krankenwagen` som ett yttrande förblir det en enda token. Markeras därför `krankenwagen` som en enskild entitet.
Nederländska `nl-nl`	1.0.0	Tokeniserar ord genom att dela upp dem med hjälp av en maskininlärningsbaserad tokeniserare som försöker dela upp sammansatta ord i sina enskilda komponenter. Om en användare anges som ett yttrande, omvandlas `Ik ga naar de kleuterschool` den till `Ik ga naar de kleuter school`. Tillåta märkning av `kleuter` och `school` oberoende som olika entiteter.
Nederländska `nl-nl`	1.0.1	Tokeniserar ord genom att dela upp dem i blanksteg. Om en användare anges `Ik ga naar de kleuterschool` som ett yttrande förblir det en enda token. Markeras därför `kleuterschool` som en enskild entitet.

Migrera mellan tokenizer-versioner

Tokenisering sker på appnivå. Det finns inget stöd för tokenisering på versionsnivå.

Importera filen som en ny app i stället för en version. Den här åtgärden innebär att den nya appen har ett annat app-ID men använder den tokenizerversion som anges i filen.

Dela via