Delen via


Taal- en regioondersteuning voor LUIS

Belangrijk

LUIS wordt op 1 oktober 2025 buiten gebruik gesteld en vanaf 1 april 2023 kunt u geen nieuwe LUIS-resources maken. We raden u aan uw LUIS-toepassingen te migreren naar gesprekstaalbegrip om te profiteren van continue productondersteuning en meertalige mogelijkheden.

LUIS heeft diverse functies binnen de service. Niet alle functies bevinden zich in dezelfde taalpariteit. Zorg ervoor dat de functies die u interesseren, worden ondersteund in de taalcultuur die u als doel heeft. Een LUIS-app is cultuurspecifiek en kan niet worden gewijzigd zodra deze is ingesteld.

Meertalige LUIS-apps

Als u een meertalige LUIS-clienttoepassing zoals een chatbot nodig hebt, hebt u een aantal opties. Als LUIS alle talen ondersteunt, ontwikkelt u een LUIS-app voor elke taal. Elke LUIS-app heeft een unieke app-id en eindpuntlogboek. Als u taalkennis wilt bieden voor een taal die LUIS niet ondersteunt, kunt u de Translator-service gebruiken om de utterance te vertalen in een ondersteunde taal, de utterance naar het LUIS-eindpunt te verzenden en de resulterende scores te ontvangen.

Notitie

Een nieuwere versie van Language Understanding-mogelijkheden is nu beschikbaar als onderdeel van Azure AI Language. Zie de documentatie voor Azure AI Language voor meer informatie. Zie Conversational Language Understanding (Conversational Language Understanding) voor taalkennismogelijkheden die ondersteuning bieden voor meerdere talen in de Language Service.

Ondersteunde talen

LUIS begrijpt uitingen in de volgende talen:

Taal Landinstelling Vooraf samengesteld domein Vooraf gemaakte entiteit Aanbevelingen voor woordgroepenlijst **Sentimentanalyse en sleuteltermextractie
Arabisch (preview - moderne standaard Arabisch) ar-AR - - - -
*Chinees zh-CN -
Nederlands nl-NL - -
Engels (Verenigde Staten) en-US
Engels (VK) en-GB
Frans (Canada) fr-CA - - -
Frans (Frankrijk) fr-FR
Duits de-DE
Gujarati (preview) gu-IN - - - -
Hindi (preview) hi-IN - - -
Italiaans it-IT
*Japans ja-JP Alleen sleutelterm
Koreaans ko-KR - - Alleen sleutelterm
Marathi (preview) mr-IN - - - -
Portugees (Brazilië) pt-BR niet alle subculturen
Spaans (Mexico) es-MX -
Spaans (Spanje) es-ES
Tamil (preview) ta-IN - - - -
Telugu (preview) te-IN - - - -
Turks tr-TR - Alleen gevoel

Taalondersteuning varieert voor vooraf gedefinieerde entiteiten en vooraf gedefinieerde domeinen.

*Chinese ondersteuningsnotities

  • In de zh-CN cultuur verwacht LUIS de vereenvoudigde Chinese tekenset in plaats van de traditionele tekenset.
  • De namen van intenties, entiteiten, functies en reguliere expressies kunnen bestaan uit Chinese of Romeinse tekens.
  • Zie de referentie voor vooraf gedefinieerde domeinen voor informatie over welke vooraf gedefinieerde domeinen worden ondersteund in de zh-CN cultuur.

*Japanse ondersteuningsnotities

  • Omdat LUIS geen syntactische analyse biedt en het verschil tussen Keigo en informeel Japans niet begrijpt, moet u de verschillende formaliteitsniveaus opnemen als trainingsvoorbeelden voor uw toepassingen.
    • でございます is niet hetzelfde als です.
    • です is niet hetzelfde als だ.

**Ondersteuningsnotities voor taalservice

De Language-service bevat vooraf samengestelde keyPhrase-entiteit en sentimentanalyse. Alleen Portugees wordt ondersteund voor subculturen: pt-PT en pt-BR. Alle andere culturen worden ondersteund op het niveau van de primaire cultuur.

Ondersteunde talen voor speech-API

Zie ondersteunde talen voor spraak dicteermodustalen.

Ondersteunde talen voor Bing Spellingcontrole

Zie ondersteunde talen voor Bing Spellingcontrole voor een lijst met ondersteunde talen en status.

Zeldzame of vreemde woorden in een toepassing

In de en-us cultuur leert LUIS de meeste Engelse woorden te onderscheiden, waaronder slang. In de zh-cn cultuur leert LUIS de meeste Chinese tekens te onderscheiden. Als u een zeldzaam woord of teken in en-us zh-cngebruikt en u ziet dat LUIS dat woord of teken niet kan onderscheiden, kunt u dat woord of teken toevoegen aan een woordgroepsfunctie. Woorden buiten de cultuur van de toepassing, dat wil zeggen, vreemde woorden, moeten worden toegevoegd aan een woordgroepenlijstfunctie.

Hybride talen

Hybride talen combineren woorden uit twee culturen, zoals Engels en Chinees. Deze talen worden niet ondersteund in LUIS omdat een app is gebaseerd op één cultuur.

Tokenisatie

Om machine learning uit te voeren, breekt LUIS een uiting in tokens op basis van cultuur.

Taal elke spatie of speciaal teken tekenniveau samengestelde woorden
Arabisch
Chinees
Nederlands
Engels (en-us)
Engels (en-GB)
Frans (fr-FR)
Frans (fr-CA)
Duits
Gujarati
Hindi
Italiaans
Japans
Koreaans
Mahrati
Portugees (Brazilië)
Spaans (es-ES)
Spaans (es-MX)
Tamil
Telugu
Turks

Aangepaste tokenizerversies

De volgende culturen hebben aangepaste tokenizerversies:

Cultuur Versie Doel
Duits
de-de
1.0.0 Tokenizet woorden door ze te splitsen met behulp van een machine learning-tokenizer die samengestelde woorden in hun afzonderlijke onderdelen probeert op te splitsen.
Als een gebruiker invoert Ich fahre einen krankenwagen als een uiting, wordt deze omgezet in Ich fahre einen kranken wagen. Het markeren van kranken en wagen onafhankelijk van elkaar als verschillende entiteiten toestaan.
Duits
de-de
1.0.2 Tokenizet woorden door ze op spaties te splitsen.
Als een gebruiker als een uiting invoert Ich fahre einen krankenwagen , blijft dit één token. Wordt dus krankenwagen gemarkeerd als één entiteit.
Nederlands
nl-nl
1.0.0 Tokenizet woorden door ze te splitsen met behulp van een machine learning-tokenizer die samengestelde woorden in hun afzonderlijke onderdelen probeert op te splitsen.
Als een gebruiker invoert Ik ga naar de kleuterschool als een uiting, wordt deze omgezet in Ik ga naar de kleuter school. Het markeren van kleuter en school onafhankelijk van elkaar als verschillende entiteiten toestaan.
Nederlands
nl-nl
1.0.1 Tokenizet woorden door ze op spaties te splitsen.
Als een gebruiker als een uiting invoert Ik ga naar de kleuterschool , blijft dit één token. Wordt dus kleuterschool gemarkeerd als één entiteit.

Migreren tussen tokenizer-versies

Tokenisatie vindt plaats op app-niveau. Er is geen ondersteuning voor tokenisatie op versieniveau.

Importeer het bestand als een nieuwe app in plaats van een versie. Deze actie betekent dat de nieuwe app een andere app-id heeft, maar de versie van de tokenizer gebruikt die is opgegeven in het bestand.