Termer och definitioner som används för att förstå konversationsspråk
Använd den här artikeln om du vill veta mer om några av de definitioner och termer som du kan stöta på när du använder förståelse för konversationsspråk.
Enhet
Entiteter är ord i yttranden som beskriver information som används för att uppfylla eller identifiera en avsikt. Om din entitet är komplex och du vill att din modell ska identifiera specifika delar kan du dela upp din modell i underentiteter. Du kanske till exempel vill att din modell ska förutsäga en adress, men även underentiteterna gata, stad, delstat och postnummer.
F1-poäng
F1-poängen är en funktion av Precision och Recall. Det behövs när du söker en balans mellan precision och återkallande.
Avsikt
En avsikt representerar en uppgift eller åtgärd som användaren vill utföra. Det är ett syfte eller mål som uttrycks i en användares indata, till exempel att boka en flygning eller betala en faktura.
Lista entitet
En listentitet representerar en fast, stängd uppsättning relaterade ord tillsammans med deras synonymer. Listentiteter är exakta matchningar, till skillnad från maskininlärda entiteter.
Entiteten förutsägs om ett ord i listentiteten ingår i listan. Om du till exempel har en listentitet med namnet "size" och du har orden "small, medium, large" i listan, förutsägs storleksentiteten för alla yttranden där orden "small", "medium" eller "large" används oavsett kontext.
Modell
En modell är ett objekt som har tränats att utföra en viss uppgift, i det här fallet konversationsförstålliga uppgifter. Modeller tränas genom att tillhandahålla etiketterade data att lära av så att de senare kan användas för att förstå yttranden.
- Modellutvärdering är den process som sker direkt efter träningen för att veta hur väl modellen presterar.
- Distribution är processen att tilldela din modell till en distribution för att göra den tillgänglig för användning via förutsägelse-API:et.
Överanpassning
Överanpassning sker när modellen korrigeras i de specifika exemplen och inte kan generalisera väl.
Precision
Mäter hur exakt/exakt din modell är. Det är förhållandet mellan de korrekt identifierade positiva identifieringarna (sanna positiva identifieringar) och alla identifierade positiva identifieringar. Precisionsmåttet visar hur många av de förutsagda klasserna som är korrekt märkta.
Projekt
Ett projekt är ett arbetsområde för att skapa dina anpassade ML-modeller baserat på dina data. Ditt projekt kan bara nås av dig och andra som har åtkomst till den Azure-resurs som används.
Återkalla
Mäter modellens förmåga att förutsäga faktiska positiva klasser. Det är förhållandet mellan de förutsagda sanna positiva och vad som faktiskt taggades. Återkallningsmåttet visar hur många av de förutsagda klasserna som är korrekta.
Regular expression
En entitet för reguljära uttryck representerar ett reguljärt uttryck. Reguljära uttrycksentiteter är exakta matchningar.
Schema
Schemat definieras som en kombination av avsikter och entiteter i projektet. Schemadesign är en viktig del av projektets framgång. När du skapar ett schema vill du tänka på vilka avsikter och entiteter som ska ingå i projektet.
Träningsdata
Träningsdata är den uppsättning information som behövs för att träna en modell.
Yttrande
Ett yttrande är användarindata som är korta textrepresentanter för en mening i en konversation. Det är en naturlig språkfras som "boka 2 biljetter till Seattle nästa tisdag". Exempelyttranden läggs till för att träna modellen och modellen förutsäger nya yttranden vid körning
Nästa steg
- Data- och tjänstbegränsningar.
- Översikt över förståelse av konversationsspråk.