Språk- och regionstöd för LUIS
Viktigt!
LUIS dras tillbaka den 1 oktober 2025 och från och med den 1 april 2023 kommer du inte att kunna skapa nya LUIS-resurser. Vi rekommenderar att du migrerar dina LUIS-program till förståelse för konversationsspråk för att dra nytta av fortsatt produktsupport och flerspråkiga funktioner.
Det finns flera olika funktioner i tjänsten LUIS. Vilka funktioner som stöds varierar mellan olika språk. Kontrollera att de funktioner som du är intresserad av stöds i målspråkkulturen. En LUIS-app är kulturspecifik och kan inte ändras när den har angetts.
Flerspråkiga LUIS-appar
Om du behöver ett flerspråkigt LUIS-klientprogram, till exempel en chattrobot, har du några alternativ. Om LUIS stöder alla språk utvecklar du en LUIS-app för varje språk. Varje LUIS-app har ett unikt app-ID och en slutpunktslogg. Om du behöver tillhandahålla språktolkning för ett språk som LUIS inte stöder kan du använda Translator-tjänsten för att översätta yttrandet till ett språk som stöds, skicka yttrandet till LUIS-slutpunkten och ta emot resultatet.
Kommentar
En nyare version av Funktionerna i Language Understanding är nu tillgänglig som en del av Azure AI Language. Mer information finns i Dokumentation om Azure AI Language. Information om funktioner för språktolkning som stöder flera språk i språktjänsten finns i Konversationsspråkförstårelse.
Språk som stöds
LUIS förstår yttranden på följande språk:
Språk | Nationella inställningar | Fördefinierad domän | Fördefinierad entitet | Rekommendationer för fraslista | **Sentimentanalys och extrahering av nyckelfraser |
---|---|---|---|---|---|
Arabiska (förhandsversion – modern standard arabiska) | ar-AR |
- | - | - | - |
*Kinesiska | zh-CN |
✔ | ✔ | ✔ | - |
Nederländska | nl-NL |
✔ | - | - | ✔ |
Engelska (USA) | en-US |
✔ | ✔ | ✔ | ✔ |
English (Storbritannien) | en-GB |
✔ | ✔ | ✔ | ✔ |
Franska (Kanada) | fr-CA |
- | - | - | ✔ |
Franska (Frankrike) | fr-FR |
✔ | ✔ | ✔ | ✔ |
Tyska | de-DE |
✔ | ✔ | ✔ | ✔ |
Gujarati (förhandsversion) | gu-IN |
- | - | - | - |
Hindi (förhandsversion) | hi-IN |
- | ✔ | - | - |
Italienska | it-IT |
✔ | ✔ | ✔ | ✔ |
*Japanska | ja-JP |
✔ | ✔ | ✔ | Endast nyckelfras |
Koreanska | ko-KR |
✔ | - | - | Endast nyckelfras |
Marathi (förhandsversion) | mr-IN |
- | - | - | - |
Portugisiska (Brasilien) | pt-BR |
✔ | ✔ | ✔ | inte alla underkulturer |
Spanska (Mexiko) | es-MX |
- | ✔ | ✔ | ✔ |
Spanska (Spanien) | es-ES |
✔ | ✔ | ✔ | ✔ |
Tamil (förhandsversion) | ta-IN |
- | - | - | - |
Telugu (förhandsversion) | te-IN |
- | - | - | - |
Turkiska | tr-TR |
✔ | ✔ | - | Endast sentiment |
Språkstöd varierar för fördefinierade entiteter och fördefinierade domäner.
*Kinesiska supportanteckningar
zh-CN
I kulturen förväntar sig LUIS den förenklade kinesiska teckenuppsättningen i stället för den traditionella teckenuppsättningen.- Namnen på avsikter, entiteter, funktioner och reguljära uttryck kan vara i kinesiska eller romerska tecken.
- Se referensen för fördefinierade domäner för information om vilka fördefinierade domäner som stöds i
zh-CN
kulturen.
*Japanska supportanteckningar
- Eftersom LUIS inte tillhandahåller syntaktisk analys och inte förstår skillnaden mellan Keigo och informell japanska, måste du införliva de olika formalitetsnivåerna som utbildningsexempel för dina program.
- でございます är inte samma som です.
- です är inte samma som だ.
**Supportanteckningar för språktjänsten
Språktjänsten innehåller keyPhrase-fördefinierad entitets- och attitydanalys. Endast portugisiska stöds för subkulturer: pt-PT
och pt-BR
. Alla andra kulturer stöds på den primära kulturnivån.
Språk som stöds av Speech API
Se Språk som stöds av tal för språk i taldikteringsläge.
Språk som stöds i stavningskontroll i Bing
En lista över språk och status som stöds finns i Språk som stöds i stavningskontroll i Bing.
Sällsynta eller främmande ord i ett program
en-us
I kulturen lär sig LUIS att skilja de flesta engelska ord, inklusive slang. zh-cn
I kulturen lär sig LUIS att skilja de flesta kinesiska tecken. Om du använder ett sällsynt ord i en-us
eller tecken i zh-cn
, och du ser att LUIS inte verkar kunna särskilja det ordet eller tecknet, kan du lägga till det ordet eller tecknet i en fraslista. Till exempel bör ord utanför programmets kultur , det vill säga främmande ord, läggas till i en fraslista.
Hybridspråk
Hybridspråk kombinerar ord från två kulturer som engelska och kinesiska. Dessa språk stöds inte i LUIS eftersom en app baseras på en enda kultur.
Tokenisering
För att utföra maskininlärning delar LUIS in ett yttrande i token baserat på kultur.
Språk | varje blanksteg eller specialtecken | teckennivå | sammansatta ord |
---|---|---|---|
Arabiska | ✔ | ||
Kinesiska | ✔ | ||
Nederländska | ✔ | ✔ | |
Engelska (en-us) | ✔ | ||
Engelska (en-GB) | ✔ | ||
Franska (fr-FR) | ✔ | ||
Franska (fr-CA) | ✔ | ||
Tyska | ✔ | ✔ | |
Gujarati | ✔ | ||
Hindi | ✔ | ||
Italienska | ✔ | ||
Japanska | ✔ | ||
Koreanska | ✔ | ||
Marathi | ✔ | ||
Portugisiska (Brasilien) | ✔ | ||
Spanska (es-ES) | ✔ | ||
Spanska (es-MX) | ✔ | ||
Tamilska | ✔ | ||
Telugu | ✔ | ||
Turkiska | ✔ |
Anpassade tokenizerversioner
Följande kulturer har anpassade tokenizer-versioner:
Kultur | Version | Syfte |
---|---|---|
Tyskade-de |
1.0.0 | Tokeniserar ord genom att dela upp dem med hjälp av en maskininlärningsbaserad tokeniserare som försöker dela upp sammansatta ord i sina enskilda komponenter. Om en användare anges som ett yttrande, omvandlas Ich fahre einen krankenwagen den till Ich fahre einen kranken wagen . Tillåta märkning av kranken och wagen oberoende som olika entiteter. |
Tyskade-de |
1.0.2 | Tokeniserar ord genom att dela upp dem i blanksteg. Om en användare anges Ich fahre einen krankenwagen som ett yttrande förblir det en enda token. Markeras därför krankenwagen som en enskild entitet. |
Nederländskanl-nl |
1.0.0 | Tokeniserar ord genom att dela upp dem med hjälp av en maskininlärningsbaserad tokeniserare som försöker dela upp sammansatta ord i sina enskilda komponenter. Om en användare anges som ett yttrande, omvandlas Ik ga naar de kleuterschool den till Ik ga naar de kleuter school . Tillåta märkning av kleuter och school oberoende som olika entiteter. |
Nederländskanl-nl |
1.0.1 | Tokeniserar ord genom att dela upp dem i blanksteg. Om en användare anges Ik ga naar de kleuterschool som ett yttrande förblir det en enda token. Markeras därför kleuterschool som en enskild entitet. |
Migrera mellan tokenizer-versioner
Tokenisering sker på appnivå. Det finns inget stöd för tokenisering på versionsnivå.
Importera filen som en ny app i stället för en version. Den här åtgärden innebär att den nya appen har ett annat app-ID men använder den tokenizerversion som anges i filen.