Dela via


Språk- och regionstöd för LUIS

Viktigt!

LUIS dras tillbaka den 1 oktober 2025 och från och med den 1 april 2023 kommer du inte att kunna skapa nya LUIS-resurser. Vi rekommenderar att du migrerar dina LUIS-program till förståelse för konversationsspråk för att dra nytta av fortsatt produktsupport och flerspråkiga funktioner.

Det finns flera olika funktioner i tjänsten LUIS. Vilka funktioner som stöds varierar mellan olika språk. Kontrollera att de funktioner som du är intresserad av stöds i målspråkkulturen. En LUIS-app är kulturspecifik och kan inte ändras när den har angetts.

Flerspråkiga LUIS-appar

Om du behöver ett flerspråkigt LUIS-klientprogram, till exempel en chattrobot, har du några alternativ. Om LUIS stöder alla språk utvecklar du en LUIS-app för varje språk. Varje LUIS-app har ett unikt app-ID och en slutpunktslogg. Om du behöver tillhandahålla språktolkning för ett språk som LUIS inte stöder kan du använda Translator-tjänsten för att översätta yttrandet till ett språk som stöds, skicka yttrandet till LUIS-slutpunkten och ta emot resultatet.

Kommentar

En nyare version av Funktionerna i Language Understanding är nu tillgänglig som en del av Azure AI Language. Mer information finns i Dokumentation om Azure AI Language. Information om funktioner för språktolkning som stöder flera språk i språktjänsten finns i Konversationsspråkförstårelse.

Språk som stöds

LUIS förstår yttranden på följande språk:

Språk Nationella inställningar Fördefinierad domän Fördefinierad entitet Rekommendationer för fraslista **Sentimentanalys och extrahering av nyckelfraser
Arabiska (förhandsversion – modern standard arabiska) ar-AR - - - -
*Kinesiska zh-CN -
Nederländska nl-NL - -
Engelska (USA) en-US
English (Storbritannien) en-GB
Franska (Kanada) fr-CA - - -
Franska (Frankrike) fr-FR
Tyska de-DE
Gujarati (förhandsversion) gu-IN - - - -
Hindi (förhandsversion) hi-IN - - -
Italienska it-IT
*Japanska ja-JP Endast nyckelfras
Koreanska ko-KR - - Endast nyckelfras
Marathi (förhandsversion) mr-IN - - - -
Portugisiska (Brasilien) pt-BR inte alla underkulturer
Spanska (Mexiko) es-MX -
Spanska (Spanien) es-ES
Tamil (förhandsversion) ta-IN - - - -
Telugu (förhandsversion) te-IN - - - -
Turkiska tr-TR - Endast sentiment

Språkstöd varierar för fördefinierade entiteter och fördefinierade domäner.

*Kinesiska supportanteckningar

  • zh-CN I kulturen förväntar sig LUIS den förenklade kinesiska teckenuppsättningen i stället för den traditionella teckenuppsättningen.
  • Namnen på avsikter, entiteter, funktioner och reguljära uttryck kan vara i kinesiska eller romerska tecken.
  • Se referensen för fördefinierade domäner för information om vilka fördefinierade domäner som stöds i zh-CN kulturen.

*Japanska supportanteckningar

  • Eftersom LUIS inte tillhandahåller syntaktisk analys och inte förstår skillnaden mellan Keigo och informell japanska, måste du införliva de olika formalitetsnivåerna som utbildningsexempel för dina program.
    • でございます är inte samma som です.
    • です är inte samma som だ.

**Supportanteckningar för språktjänsten

Språktjänsten innehåller keyPhrase-fördefinierad entitets- och attitydanalys. Endast portugisiska stöds för subkulturer: pt-PT och pt-BR. Alla andra kulturer stöds på den primära kulturnivån.

Språk som stöds av Speech API

Se Språk som stöds av tal för språk i taldikteringsläge.

Språk som stöds i stavningskontroll i Bing

En lista över språk och status som stöds finns i Språk som stöds i stavningskontroll i Bing.

Sällsynta eller främmande ord i ett program

en-us I kulturen lär sig LUIS att skilja de flesta engelska ord, inklusive slang. zh-cn I kulturen lär sig LUIS att skilja de flesta kinesiska tecken. Om du använder ett sällsynt ord i en-us eller tecken i zh-cn, och du ser att LUIS inte verkar kunna särskilja det ordet eller tecknet, kan du lägga till det ordet eller tecknet i en fraslista. Till exempel bör ord utanför programmets kultur , det vill säga främmande ord, läggas till i en fraslista.

Hybridspråk

Hybridspråk kombinerar ord från två kulturer som engelska och kinesiska. Dessa språk stöds inte i LUIS eftersom en app baseras på en enda kultur.

Tokenisering

För att utföra maskininlärning delar LUIS in ett yttrande i token baserat på kultur.

Språk varje blanksteg eller specialtecken teckennivå sammansatta ord
Arabiska
Kinesiska
Nederländska
Engelska (en-us)
Engelska (en-GB)
Franska (fr-FR)
Franska (fr-CA)
Tyska
Gujarati
Hindi
Italienska
Japanska
Koreanska
Marathi
Portugisiska (Brasilien)
Spanska (es-ES)
Spanska (es-MX)
Tamilska
Telugu
Turkiska

Anpassade tokenizerversioner

Följande kulturer har anpassade tokenizer-versioner:

Kultur Version Syfte
Tyska
de-de
1.0.0 Tokeniserar ord genom att dela upp dem med hjälp av en maskininlärningsbaserad tokeniserare som försöker dela upp sammansatta ord i sina enskilda komponenter.
Om en användare anges som ett yttrande, omvandlas Ich fahre einen krankenwagen den till Ich fahre einen kranken wagen. Tillåta märkning av kranken och wagen oberoende som olika entiteter.
Tyska
de-de
1.0.2 Tokeniserar ord genom att dela upp dem i blanksteg.
Om en användare anges Ich fahre einen krankenwagen som ett yttrande förblir det en enda token. Markeras därför krankenwagen som en enskild entitet.
Nederländska
nl-nl
1.0.0 Tokeniserar ord genom att dela upp dem med hjälp av en maskininlärningsbaserad tokeniserare som försöker dela upp sammansatta ord i sina enskilda komponenter.
Om en användare anges som ett yttrande, omvandlas Ik ga naar de kleuterschool den till Ik ga naar de kleuter school. Tillåta märkning av kleuter och school oberoende som olika entiteter.
Nederländska
nl-nl
1.0.1 Tokeniserar ord genom att dela upp dem i blanksteg.
Om en användare anges Ik ga naar de kleuterschool som ett yttrande förblir det en enda token. Markeras därför kleuterschool som en enskild entitet.

Migrera mellan tokenizer-versioner

Tokenisering sker på appnivå. Det finns inget stöd för tokenisering på versionsnivå.

Importera filen som en ny app i stället för en version. Den här åtgärden innebär att den nya appen har ett annat app-ID men använder den tokenizerversion som anges i filen.