Delen via


Uitingen

Belangrijk

LUIS wordt op 1 oktober 2025 buiten gebruik gesteld en vanaf 1 april 2023 kunt u geen nieuwe LUIS-resources maken. We raden u aan uw LUIS-toepassingen te migreren naar gesprekstaalbegrip om te profiteren van continue productondersteuning en meertalige mogelijkheden.

Uitingen zijn invoer van gebruikers die uw app moet interpreteren. Om LUIS te trainen om intenties en entiteiten uit deze invoer te extraheren, is het belangrijk om verschillende voorbeelduitingen voor elke intentie vast te leggen. Actief leren, of het proces om door te gaan met het trainen van nieuwe uitingen, is essentieel voor de machine learning-intelligentie die LUIS biedt.

Verzamel uitingen die u denkt dat gebruikers invoeren. Neem utterances op, wat hetzelfde betekent, maar op verschillende manieren zijn samengesteld:

  • Uitingslengte: kort, gemiddeld en lang voor uw clienttoepassing
  • Lengte van woord en woordgroep
  • Plaatsing van Word - entiteit aan het begin, het midden en het einde van de uiting
  • Grammatica
  • Pluralisatie
  • Stemming
  • Zelfstandig naamwoord en werkwoordkeuze
  • Interpunctie : zowel de juiste als onjuiste grammatica gebruiken

Kies gevarieerde uitingen

Wanneer u voorbeelduitingen toevoegt aan uw LUIS-model, zijn er verschillende principes om rekening mee te houden:

Uitingen zijn niet altijd goed gevormd

Uw app moet mogelijk zinnen verwerken, zoals 'Boek een ticket naar Parijs voor mij', of een fragment van een zin, zoals 'Booking' of 'Paris flight' Gebruikers maken vaak spelfouten. Overweeg bij het plannen van uw app of u Bing Spellingcontrole wilt gebruiken om gebruikersinvoer te corrigeren voordat u deze doorgeeft aan LUIS.

Als u geen spellingcontrole van gebruikersuitingen gebruikt, moet u LUIS trainen op utterances die typfouten en spelfouten bevatten.

De representatieve taal van de gebruiker gebruiken

Wanneer u utterances kiest, moet u er rekening mee houden dat wat u denkt algemene termen of woordgroepen zijn, mogelijk niet gebruikelijk zijn voor de typische gebruiker van uw clienttoepassing. Ze hebben mogelijk geen domeinervaring of gebruiken verschillende terminologie. Wees voorzichtig bij het gebruik van termen of woordgroepen die een gebruiker alleen zou zeggen als ze een expert waren.

Kies gevarieerde terminologie en formulering

U zult merken dat zelfs als u moeite doet om gevarieerde zinspatronen te creëren, u nog steeds wat woordenschat herhaalt. De volgende utterances hebben bijvoorbeeld vergelijkbare betekenis, maar verschillende terminologie en formuleringen:

  • "Hoe kan ik een computer ophalen?"
  • "Waar krijg ik een computer?"
  • "Ik wil een computer krijgen, hoe ga ik eraan?"
  • 'Wanneer kan ik een computer hebben?'

De kernterm hier, computer, is niet gevarieerd. Gebruik alternatieven zoals desktopcomputer, laptop, werkstation of zelfs machine. LUIS kan op intelligente wijze synoniemen afleiden van context, maar wanneer u uitingen voor training maakt, is het altijd beter om ze te variëren.

Voorbeelduitingen in elke intentie

Elke intentie moet voorbeelduitingen hebben: ten minste 15. Als u een intentie hebt die geen voorbeelduitingen heeft, kunt u LUIS niet trainen. Als u een intentie hebt met een of weinig voorbeelduitingen, kan LUIS de intentie mogelijk niet nauwkeurig voorspellen.

Kleine groepen utterances toevoegen

Telkens wanneer u uw model doorgeeft om het te verbeteren, voegt u geen grote hoeveelheden uitingen toe. Overweeg utterances toe te voegen in hoeveelheden van 15. Train, publiceer en test opnieuw.

LUIS bouwt effectieve modellen met uitingen die zorgvuldig worden geselecteerd door de auteur van het LUIS-model. Het toevoegen van te veel utterances is niet waardevol omdat er verwarring ontstaat.

Het is beter om te beginnen met een paar utterances en vervolgens de eindpuntuitingen te controleren voor de juiste intentievoorspelling en entiteitsextractie.

Normalisatie van uitingen

Normalisatie van uitingen is het proces van het negeren van de effecten van typen tekst, zoals interpunctie en diakritische tekens, tijdens de training en voorspelling.

Normalisatie-instellingen voor uitingen zijn standaard uitgeschakeld. Deze instellingen zijn onder meer:

  • Word-formulieren
  • Diakritische tekens
  • Interpunctie

Als u een normalisatie-instelling inschakelt, worden scores in het deelvenster Testen , batchtests en eindpuntquery's gewijzigd voor alle uitingen voor die normalisatie-instelling.

Wanneer u een versie kloont in de LUIS-portal, worden de versie-instellingen bewaard in de nieuwe gekloonde versie.

Stel de versie-instellingen van uw app in met behulp van de LUIS-portal door Beheren te selecteren in het bovenste navigatiemenu op de pagina Toepassingsinstellingen. U kunt ook de API updateversie-instellingen gebruiken. Zie de referentiedocumentatie voor meer informatie.

Word-formulieren

Het normaliseren van woordvormen negeert de verschillen in woorden die verder gaan dan de hoofdmap.

Diakritische tekens

Diakritische tekens zijn markeringen of tekens in de tekst, zoals:

İ ı Ş Ğ ş ğ ö ü

Leestekens

Het normaliseren van interpunctie betekent dat voordat uw modellen worden getraind en voordat uw eindpuntquery's worden voorspeld, leestekens worden verwijderd uit de uitingen.

Interpunctie is een afzonderlijk token in LUIS. Een uiting die een punt aan het einde bevat, is een afzonderlijke uiting dan een uiting die geen punt aan het einde bevat en mogelijk twee verschillende voorspellingen krijgt.

Als interpunctie niet is genormaliseerd, negeert LUIS standaard geen interpunctiemarkeringen omdat sommige clienttoepassingen mogelijk significantie op deze markeringen plaatsen. Zorg ervoor dat u voorbeelduitingen opneemt die interpunctie gebruiken en niet, voor beide stijlen om dezelfde relatieve scores te retourneren.

Zorg ervoor dat het model interpunctie afhandelt in de voorbeelduitingen (zowel met interpunctie als niet met interpunctie) of in patronen waarin interpunctie gemakkelijker kan worden genegeerd. Bijvoorbeeld: Ik vraag me aan voor de positie {Job}[.]

Als interpunctie geen specifieke betekenis heeft in uw clienttoepassing, kunt u overwegen interpunctie te negeren door interpunctie te normaliseren.

Woorden en leestekens negeren

Als u bepaalde woorden of interpunctie in patronen wilt negeren, gebruikt u een patroon met de genegeerde syntaxis van vierkante haken. []

Training met alle utterances

Training is niet-deterministisch: utterancevoorspelling kan enigszins verschillen in versies of apps. U kunt niet-deterministische training verwijderen door de API voor versie-instellingen bij te werken met het useAllTrainingData-naam-/waardepaar om alle trainingsgegevens te gebruiken.

Uitingen testen

Ontwikkelaars moeten beginnen met het testen van hun LUIS-toepassing met echte gegevens door uitingen te verzenden naar de URL van het voorspellingseindpunt . Deze utterances worden gebruikt om de prestaties van de intenties en entiteiten met review-utterances te verbeteren. Tests die zijn verzonden met behulp van het testvenster in de LUIS-portal, worden niet via het eindpunt verzonden en dragen niet bij aan actief leren.

Utterances controleren

Nadat uw model is getraind, gepubliceerd en eindpuntquery's ontvangt, controleert u de uitingen die door LUIS worden voorgesteld. LUIS selecteert eindpuntuitingen met lage scores voor de intentie of entiteit.

Aanbevolen procedures

Label voor woord betekenis

Als de woordkeuze of woordindeling hetzelfde is, maar niet hetzelfde betekent, moet u deze niet labelen met de entiteit.

In de volgende uitingen is het woord fair een homograaf, wat betekent dat het hetzelfde is gespeld, maar een andere betekenis heeft:

  • "Welke soorten districtsfeesten gebeuren deze zomer in de regio Seattle?"
  • "Is de huidige 2-sterrenclassificatie voor de restaurantbeurs?

Als u wilt dat een gebeurtenisentiteit alle gebeurtenisgegevens vindt, labelt u het woord fair in de eerste uiting, maar niet in de tweede.

Negeer mogelijke utterancevariaties niet

LUIS verwacht variaties in de uitingen van een intentie. De utterances kunnen variëren terwijl ze dezelfde algemene betekenis hebben. Variaties kunnen uitingslengte, woordkeuze en woordplaatsing omvatten.

Gebruik niet dezelfde indeling Gebruik verschillende indelingen
Een ticket kopen voor Seattle Koop 1 ticket naar Seattle
Een ticket kopen voor Parijs Reserveer twee kaartjes op het rode oog naar Parijs volgende maandag
Een ticket kopen bij Orlando Ik wil graag 3 tickets boeken voor Orlando voor de lente-break

De tweede kolom gebruikt verschillende werkwoorden (kopen, reserveren, boeken), verschillende hoeveelheden (1, &"twee", 3) en verschillende rangschikkingen van woorden, maar hebben allemaal dezelfde bedoeling om vliegtickets voor reizen te kopen.

Voeg niet te veel voorbeelduitingen toe aan intenties

Nadat de app is gepubliceerd, voegt u alleen utterances toe van actief leren in het levenscyclusproces voor ontwikkeling. Als utterances te vergelijkbaar zijn, voegt u een patroon toe.

Volgende stappen