Woordenlijst voor taalbegrip van algemene woordenlijst en concepten
Belangrijk
LUIS wordt op 1 oktober 2025 buiten gebruik gesteld en vanaf 1 april 2023 kunt u geen nieuwe LUIS-resources maken. We raden u aan uw LUIS-toepassingen te migreren naar gesprekstaalbegrip om te profiteren van continue productondersteuning en meertalige mogelijkheden.
In de woordenlijst language Understanding (LUIS) worden termen uitgelegd die u kunt tegenkomen wanneer u met de LUIS-service werkt.
Actieve versie
De actieve versie is de versie van uw app die wordt bijgewerkt wanneer u wijzigingen aanbrengt in het model met behulp van de LUIS-portal. Als u in de LUIS-portal wijzigingen wilt aanbrengen in een versie die niet de actieve versie is, moet u die versie eerst instellen als actief.
Actief leren
Actief leren is een techniek van machine learning waarin het machine learning-model wordt gebruikt om informatieve nieuwe voorbeelden te identificeren die moeten worden gelabeld. In LUIS verwijst actief leren naar het toevoegen van utterances uit het eindpuntverkeer waarvan de huidige voorspellingen onduidelijk zijn om uw model te verbeteren. Selecteer 'Eindpuntuitingen controleren' om uitingen weer te geven die u wilt labelen.
Zie ook:
- Conceptuele informatie
- Zelfstudie over het controleren van eindpuntuitingen
- De LUIS-app verbeteren door eindpuntuitingen te controleren
Toepassing (app)
In LUIS, uw toepassing of app, is een verzameling machine learning-modellen, gebouwd op dezelfde gegevensset, die samenwerken om intenties en entiteiten voor een bepaald scenario te voorspellen. Elke toepassing heeft een afzonderlijk voorspellingseindpunt.
Als u een HR-bot bouwt, hebt u mogelijk een set intenties, zoals 'Vertrektijd plannen', 'vragen over voordelen' en 'persoonlijke gegevens bijwerken' en entiteiten voor elk van deze intenties die u groepeert in één toepassing.
Ontwerpen
Ontwerpen is de mogelijkheid om een LUIS-app te maken, beheren en implementeren met behulp van de LUIS-portal of de creatie-API's.
Ontwerpsleutel
De ontwerpsleutel wordt gebruikt om de app te ontwerpen. Niet gebruikt voor eindpuntquery's op productieniveau. Zie resourcelimieten voor meer informatie.
Ontwerpresource
Uw LUIS-ontwerpresource is een beheerbaar item dat beschikbaar is via Azure. De resource is uw toegang tot de bijbehorende creatie-, trainings- en publicatiemogelijkheden van de Azure-service. De resource bevat verificatie-, autorisatie- en beveiligingsgegevens die u nodig hebt voor toegang tot de bijbehorende Azure-service.
De ontwerpresource heeft een Azure-soort LUIS-Authoring
.
Batch-test
Batch-tests zijn de mogelijkheid om de modellen van een huidige LUIS-app te valideren met een consistente en bekende testset gebruikersuitingen. De batchtest wordt gedefinieerd in een bestand met JSON-indeling.
Zie ook:
- Concepten
- Een batchtest uitvoeren
- Zelfstudie : een batchtest maken en uitvoeren
F-meting
Bij batchtests wordt een meting van de nauwkeurigheid van de test uitgevoerd.
Fout-negatief (FN)
Bij batchtests vertegenwoordigen de gegevenspunten utterances waarin uw app ten onrechte de afwezigheid van de doelint/entiteit heeft voorspeld.
Fout-positief (FP)
Bij batchtests vertegenwoordigen de gegevenspunten utterances waarin uw app het bestaan van de doelint/entiteit onjuist heeft voorspeld.
Precisie
Bij batchtests is precisie (ook wel positieve voorspellende waarde genoemd) de fractie van relevante utterances tussen de opgehaalde utterances.
Een voorbeeld voor een dierbatchtest is het aantal schapen dat is voorspeld door het totale aantal dieren (schapen en niet-schapen).
Intrekken
Bij batchtests is relevante overeenkomsten (ook wel gevoeligheid genoemd) de mogelijkheid voor LUIS om te generaliseren.
Een voorbeeld voor een dierbatchtest is het aantal schapen dat is voorspeld door het totale aantal beschikbare schapen.
Terecht-negatief (TN)
Een terecht negatief is wanneer uw app geen overeenkomst correct voorspelt. Bij batchtests treedt een terecht negatief op wanneer uw app een intentie of entiteit voorspelt voor een voorbeeld dat niet is gelabeld met die intentie of entiteit.
Terecht-positief (TP)
Terecht positief (TP) Een terecht positief is wanneer uw app een overeenkomst correct voorspelt. Bij batchtests treedt een terecht-positief op wanneer uw app een intentie of entiteit voorspelt voor een voorbeeld dat is gelabeld met die intentie of entiteit.
Classificatie
Een classificatie is een machine learning-model waarmee wordt voorspeld in welke categorie of klasse een invoer past.
Een intentie is een voorbeeld van een classificatie.
Samenwerker
Een samenwerker is conceptueel hetzelfde als een inzender. Een samenwerker krijgt toegang wanneer een eigenaar het e-mailadres van de samenwerker toevoegt aan een app die niet wordt beheerd met op rollen gebaseerd toegangsbeheer van Azure (Azure RBAC). Als u nog steeds samenwerkers gebruikt, moet u uw LUIS-account migreren en LUIS-creatieresources gebruiken om inzenders te beheren met Azure RBAC.
Inzender
Een inzender is niet de eigenaar van de app, maar heeft dezelfde machtigingen om de intenties, entiteiten, uitingen toe te voegen, te bewerken en te verwijderen. Een inzender biedt op rollen gebaseerd toegangsbeheer van Azure (Azure RBAC) voor een LUIS-app.
Zie ook:
Descriptor
Een descriptor is de term die voorheen werd gebruikt voor een machine learning-functie.
Domein
In de LUIS-context is een domein een kennisgebied. Uw domein is specifiek voor uw scenario. Verschillende domeinen gebruiken specifieke taal en terminologie die betekenis hebben in de context van het domein. Als u bijvoorbeeld een toepassing bouwt om muziek af te spelen, heeft uw toepassing termen en taal die specifiek is voor muziek, zoals 'song, track, album, lyrics, b-side, artist'. Zie vooraf samengestelde domeinen voor voorbeelden van domeinen.
Eindpunt
Eindpunt ontwerpen
De EINDPUNT-URL voor LUIS-creatie is de locatie waar u uw app ontwerpt, traint en publiceert. De eindpunt-URL bevat de regio of het aangepaste subdomein van de gepubliceerde app, evenals de app-id.
Meer informatie over het programmatisch ontwerpen van uw app via de naslaginformatie voor ontwikkelaars
Voorspellingseindpunt
De URL van het LUIS-voorspellingseindpunt is de locatie waar u LUIS-query's verzendt nadat de LUIS-app is gemaakt en gepubliceerd. De eindpunt-URL bevat de regio of het aangepaste subdomein van de gepubliceerde app, evenals de app-id. U vindt het eindpunt op de pagina Azure-resources van uw app of u kunt de eindpunt-URL ophalen via de API App-info ophalen.
Uw toegang tot het voorspellingseindpunt is geautoriseerd met de LUIS-voorspellingssleutel.
Entity
Entiteiten zijn woorden in uitingen die informatie beschrijven die wordt gebruikt om een intentie te vervullen of te identificeren. Als uw entiteit complex is en u wilt dat uw model specifieke onderdelen identificeert, kunt u uw model opsplitsen in subentiteiten. U wilt bijvoorbeeld dat uw model een adres voorspelt, maar ook de subentiteiten straat, plaats, staat en postcode. Entiteiten kunnen ook worden gebruikt als functies voor modellen. Uw reactie van de LUIS-app bevat zowel de voorspelde intenties als alle entiteiten.
Entiteitsextractor
Een entiteitsextractor die soms alleen bekend staat als een extractor, is het type machine learning-model dat LUIS gebruikt om entiteiten te voorspellen.
Entiteitsschema
Het entiteitsschema is de structuur die u definieert voor door machine geleerde entiteiten met subentiteiten. Het voorspellingseindpunt retourneert alle geëxtraheerde entiteiten en subentiteiten die in het schema zijn gedefinieerd.
Subentiteit van entiteit
Een subentiteit is een onderliggende entiteit van een machine learning-entiteit.
Niet-machine learning-entiteit
Een entiteit die gebruikmaakt van tekstkoppeling om gegevens te extraheren:
- Lijstentiteit
- Een entiteit in de vorm van een reguliere expressie
Lijstentiteit
Een lijstentiteit vertegenwoordigt een vaste, gesloten set gerelateerde woorden, samen met hun synoniemen. Lijstentiteiten zijn exacte overeenkomsten, in tegenstelling tot machined learning-entiteiten.
De entiteit wordt voorspeld als een woord in de lijstentiteit is opgenomen in de lijst. Als u bijvoorbeeld een lijstentiteit met de naam 'grootte' hebt en u de woorden 'klein, gemiddeld, groot' in de lijst hebt, wordt de entiteit grootte voorspeld voor alle uitingen waarbij de woorden 'klein', 'gemiddeld' of 'groot' worden gebruikt, ongeacht de context.
Regular expression
Een entiteit met een reguliere expressie vertegenwoordigt een reguliere expressie. Reguliere expressie-entiteiten zijn exacte overeenkomsten, in tegenstelling tot machined learning-entiteiten.
Vooraf gemaakte entiteit
Zie de vermelding van het vooraf samengestelde model voor vooraf gemaakte entiteit.
Functies
In machine learning is een functie een kenmerk waarmee het model een bepaald concept kan herkennen. Het is een hint die LUIS kan gebruiken, maar geen harde regel.
Deze term wordt ook wel een machine learning-functie genoemd.
Deze hints worden gebruikt met de labels om te leren hoe u nieuwe gegevens voorspelt. LUIS ondersteunt zowel woordgroepenlijsten als het gebruik van andere modellen als functies.
Vereiste functie
Een vereiste functie is een manier om de uitvoer van een LUIS-model te beperken. Wanneer een functie voor een entiteit is gemarkeerd als vereist, moet de functie aanwezig zijn in het voorbeeld dat de entiteit moet worden voorspeld, ongeacht wat het machine learning-model voorspelt.
Bekijk een voorbeeld waarbij u een vooraf gedefinieerde functie hebt die u hebt gemarkeerd als vereist voor de entiteit hoeveelheid voor een menuvolgordebot. Wanneer uw bot ziet I want a bajillion large pizzas?
, wordt bajillion niet voorspeld als een hoeveelheid, ongeacht de context waarin deze wordt weergegeven. Bajillion is geen geldig getal en wordt niet voorspeld door de vooraf gedefinieerde getalentiteit.
Intentie
Een intentie vertegenwoordigt een taak of actie die de gebruiker wil uitvoeren. Het is een doel of doel uitgedrukt in de invoer van een gebruiker, zoals het boeken van een vlucht of het betalen van een factuur. In LUIS wordt een uiting als geheel geclassificeerd als een intentie, maar delen van de uiting worden geëxtraheerd als entiteiten.
Voorbeelden van labelen
Labelen of markeren is het proces van het koppelen van een positief of negatief voorbeeld aan een model.
Labelen voor intenties
In LUIS sluiten intenties binnen een app elkaar wederzijds uit. Dit betekent dat wanneer u een uiting toevoegt aan een intentie, het wordt beschouwd als een positief voorbeeld voor die intentie en een negatief voorbeeld voor alle andere intenties. Negatieve voorbeelden mogen niet worden verward met de intentie 'Geen', die uitingen vertegenwoordigt die buiten het bereik van de app vallen.
Labelen voor entiteiten
In LUIS labelt u een woord of woordgroep in de voorbeelduiting van een intentie met een entiteit als een positief voorbeeld. Labelen toont de intentie die moet worden voorspeld voor die uiting. De gelabelde utterances worden gebruikt om de intentie te trainen.
LUIS-app
Zie de definitie voor de toepassing (app).
Modelleren
Een (machine learning)-model is een functie die een voorspelling doet over invoergegevens. In LUIS verwijzen we naar intentieclassificaties en entiteitsextracties algemeen als 'modellen', en verwijzen we naar een verzameling modellen die samen worden getraind, gepubliceerd en opgevraagd als een 'app'.
Genormaliseerde waarde
U voegt waarden toe aan uw lijstentiteiten . Elk van deze waarden kan een lijst met een of meer synoniemen bevatten. Alleen de genormaliseerde waarde wordt geretourneerd in het antwoord.
Overfitting
Overfitting treedt op wanneer het model wordt gefixeerd op de specifieke voorbeelden en niet goed kan generaliseren.
Eigenaar
Elke app heeft één eigenaar die de persoon is die de app heeft gemaakt. De eigenaar beheert machtigingen voor de toepassing in Azure Portal.
Woordgroepenlijst
Een woordgroepenlijst is een specifiek type machine learning-functie met een groep waarden (woorden of woordgroepen) die deel uitmaken van dezelfde klasse en moet op dezelfde manier worden behandeld (bijvoorbeeld namen van steden of producten).
Vooraf samengesteld model
Een vooraf samengesteld model is een intentie, entiteit of verzameling van beide, samen met gelabelde voorbeelden. Deze veelgebruikte vooraf samengestelde modellen kunnen aan uw app worden toegevoegd om het benodigde modelontwikkelingswerk voor uw app te verminderen.
Vooraf samengesteld domein
Een vooraf samengesteld domein is een LUIS-app die is geconfigureerd voor een specifiek domein, zoals huisautomatisering (HomeAutomation) of restaurantreserveringen (RestaurantReservation). De intenties, uitingen en entiteiten worden geconfigureerd voor dit domein.
Vooraf gemaakte entiteit
Een vooraf gedefinieerde entiteit is een entiteit LUIS die algemene typen informatie biedt, zoals getal, URL en e-mail. Deze worden gemaakt op basis van openbare gegevens. U kunt ervoor kiezen om een vooraf samengestelde entiteit toe te voegen als een zelfstandige entiteit of als een functie aan een entiteit.
Vooraf gedefinieerde intentie
Een vooraf samengestelde intentie is een intentie die LUIS biedt voor algemene soorten informatie en worden geleverd met hun eigen gelabelde voorbeelduitingen.
Voorspelling
Een voorspelling is een REST-aanvraag voor de Azure LUIS-voorspellingsservice die nieuwe gegevens inneemt (gebruikersuiting) en de getrainde en gepubliceerde toepassing toepast op die gegevens om te bepalen welke intenties en entiteiten worden gevonden.
Voorspellingssleutel
De voorspellingssleutel is de sleutel die is gekoppeld aan de LUIS-service die u in Azure hebt gemaakt om uw gebruik van het voorspellingseindpunt te autoriseren.
Deze sleutel is niet de ontwerpsleutel. Als u een voorspellingseindpuntsleutel hebt, moet deze worden gebruikt voor eindpuntaanvragen in plaats van de ontwerpsleutel. U kunt uw huidige voorspellingssleutel zien in de eindpunt-URL onder aan de pagina Azure-resources op de LUIS-website. Dit is de waarde van het naam-/waardepaar van de abonnementssleutel.
Voorspellingsresource
Uw LUIS-voorspellingsresource is een beheerbaar item dat beschikbaar is via Azure. De resource is uw toegang tot de bijbehorende voorspelling van de Azure-service. De resource bevat voorspellingen.
De voorspellingsresource heeft een Azure-soort LUIS
.
Voorspellingsscore
De score is een getal van 0 en 1 dat een meting is van hoe zeker het systeem is dat een bepaalde invoeruiting overeenkomt met een bepaalde intentie. Een score dichter bij 1 betekent dat het systeem zeer zeker is van de uitvoer en een score dichter bij 0 betekent dat het systeem er zeker van is dat de invoer niet overeenkomt met een bepaalde uitvoer. Scores in het middelste gemiddelde dat het systeem zeer niet zeker weet hoe de beslissing moet worden genomen.
Neem bijvoorbeeld een model dat wordt gebruikt om te bepalen of sommige klanttekst een voedselorder bevat. Het kan een score van 1 geven voor "Ik wil één koffie bestellen" (het systeem is zeer zeker dat dit een order is) en een score van 0 voor "mijn team won de wedstrijd gisteravond" (het systeem is zeer zeker dat dit geen order is). En het kan een score van 0,5 hebben voor 'laten we wat thee hebben' (is niet zeker of dit een bestelling is of niet).
Programmatische sleutel
De naam is gewijzigd in de ontwerpsleutel.
Publiceren
Publiceren betekent dat een actieve LUIS-versie beschikbaar wordt gemaakt op het faserings- of productie-eindpunt.
Quotum
LUIS-quotum is de beperking van de Azure-abonnementslaag. Het LUIS-quotum kan worden beperkt door beide aanvragen per seconde (HTTP-status 429) en het totale aantal aanvragen in een maand (HTTP-status 403).
Schema
Uw schema bevat uw intenties en entiteiten, samen met de subentiteiten. Het schema wordt in eerste instantie gepland voordat het in de loop van de tijd wordt getimed. Het schema bevat geen app-instellingen, functies of voorbeelduitingen.
Sentimentanalyse
Sentimentanalyse biedt positieve of negatieve waarden van de utterances die worden geleverd door de Language-service.
Spraak voorbereiden
Spraak priming verbetert de herkenning van gesproken woorden en woordgroepen die vaak worden gebruikt in uw scenario met Speech Services. Voor toepassingen die geschikt zijn voor spraakgebruik, worden alle met LUIS gelabelde voorbeelden gebruikt om de nauwkeurigheid van spraakherkenning te verbeteren door een aangepast spraakmodel te maken voor deze specifieke toepassing. In een schaakspel wilt u er bijvoorbeeld voor zorgen dat wanneer de gebruiker 'Move knight' zegt, het niet wordt geïnterpreteerd als 'Move night'. De LUIS-app moet voorbeelden bevatten waarin 'ridder' wordt gelabeld als een entiteit.
Starterssleutel
Een gratis sleutel die moet worden gebruikt wanneer u luis voor het eerst gaat gebruiken.
Synoniemen
In LUIS-lijstentiteiten kunt u een genormaliseerde waarde maken, die elk een lijst met synoniemen kan bevatten. Als u bijvoorbeeld een grootte-entiteit maakt met genormaliseerde waarden van kleine, middelgrote, grote en extra groot. U kunt synoniemen maken voor elke waarde als volgt:
Nomalized waarde | Synoniemen |
---|---|
Klein | de kleine, 8 ounces |
Gemiddeld | normaal, 12 ounces |
Groot | groot, 16 ounces |
Xtra groot | de grootste, 24 ounces |
Het model retourneert de genormaliseerde waarde voor de entiteit wanneer een van synoniemen wordt weergegeven in de invoer.
Testen
Het testen van een LUIS-app betekent het weergeven van modelvoorspellingen.
Tijdzoneverschil
Het eindpunt bevat tijdzoneOffset. Dit is het getal in minuten dat u wilt toevoegen aan of verwijderen uit de vooraf samengestelde entiteit datetimeV2. Als de uiting bijvoorbeeld 'hoe laat is het nu?', is de geretourneerde datum/tijdV2 de huidige tijd voor de clientaanvraag. Als uw clientaanvraag afkomstig is van een bot of een andere toepassing die niet hetzelfde is als de gebruiker van uw bot, moet u de offset tussen de bot en de gebruiker doorgeven.
Zie Tijdzone van vooraf gedefinieerde datum/tijdV2-entiteit wijzigen.
Token
Een token is de kleinste teksteenheid die LUIS kan herkennen. Dit verschilt enigszins in verschillende talen.
Voor het Engels is een token een doorlopend bereik (geen spaties of leestekens) van letters en cijfers. Een spatie is GEEN token.
Woordgroep | Aantal tokens | Uitleg |
---|---|---|
Dog |
1 | Eén woord zonder interpunctie of spaties. |
RMT33W |
1 | Een recordzoekernummer. Het kan cijfers en letters bevatten, maar heeft geen leestekens. |
425-555-5555 |
5 | Een telefoonnummer. Elk interpunctieteken is één token, dus 425-555-5555 dit zijn 5 tokens:425 - 555 - 5555 |
https://luis.ai |
7 | https : / / luis . ai |
Trainen
Training is het leerproces van LUIS over wijzigingen in de actieve versie sinds de laatste training.
Trainingsgegevens
Trainingsgegevens zijn de set informatie die nodig is om een model te trainen. Dit omvat het schema, gelabelde uitingen, functies en toepassingsinstellingen.
Trainingsfouten
Trainingsfouten zijn voorspellingen voor uw trainingsgegevens die niet overeenkomen met hun labels.
Uiting
Een uiting is gebruikersinvoer die korte tekst vertegenwoordigt van een zin in een gesprek. Het is een natuurlijke taalzin zoals 'boek 2 tickets naar Seattle volgende dinsdag'. Voorbeelduitingen worden toegevoegd om het model te trainen en het model voorspelt tijdens runtime nieuwe uitingen.
Versie
Een LUIS-versie is een specifiek exemplaar van een LUIS-toepassing die is gekoppeld aan een LUIS-app-id en het gepubliceerde eindpunt. Elke LUIS-app heeft ten minste één versie.