Dela via


Entitetskomponenter

Vid förståelse av konversationsspråk är entiteter relevant information som extraheras från dina yttranden. En entitet kan extraheras med olika metoder. De kan läras via kontext, matchas från en lista eller identifieras av en fördefinierad identifierad entitet. Varje entitet i projektet består av en eller flera av dessa metoder, som definieras som entitetens komponenter.

När en entitet definieras av mer än en komponent kan deras förutsägelser överlappa varandra. Du kan fastställa beteendet för en entitetsförutsägelse när dess komponenter överlappar med hjälp av en fast uppsättning alternativ i entitetsalternativen.

Komponenttyper

En entitetskomponent avgör hur du kan extrahera entiteten. En entitet kan innehålla en komponent som avgör den enda metod som ska användas för att extrahera entiteten. En entitet kan också innehålla flera komponenter för att utöka hur entiteten definieras och extraheras.

Inlärd komponent

Den inlärda komponenten använder entitetstaggar som du märker dina yttranden med för att träna en maskininlärd modell. Modellen lär sig att förutsäga var entiteten baseras på kontexten i yttrandet. Etiketterna innehåller exempel på var entiteten förväntas finnas i ett yttrande, baserat på innebörden av orden runt den och som de ord som var märkta.

Den här komponenten definieras bara om du lägger till etiketter genom att tagga yttranden för entiteten. Om du inte taggar några yttranden med entiteten har den ingen inlärd komponent.

Skärmbild som visar ett exempel på inlärda komponenter för entiteter.

Listkomponent

Listkomponenten representerar en fast, stängd uppsättning relaterade ord tillsammans med deras synonymer. Komponenten utför en exakt textmatchning mot listan med värden som du anger som synonymer. Varje synonym tillhör en listnyckel som kan användas som det normaliserade standardvärdet för synonymen som returneras i utdata om listkomponenten matchas. Listnycklar används inte för matchning.

I flerspråkiga projekt kan du ange en annan uppsättning synonymer för varje språk. När du använder förutsägelse-API:et kan du ange språket i indatabegäran, som endast matchar synonymerna som är associerade med det språket.

Skärmbild som visar ett exempel på listkomponenter för entiteter.

Fördefinierad komponent

Med den fördefinierade komponenten kan du välja från ett bibliotek med vanliga typer, till exempel tal, datetimes och namn. När en fördefinierad komponent läggs till identifieras den automatiskt. Du kan ha upp till fem fördefinierade komponenter per entitet. Mer information finns i listan över fördefinierade komponenter som stöds.

Skärmbild som visar ett exempel på fördefinierade komponenter för entiteter.

Regex-komponent

Regex-komponenten matchar reguljära uttryck för att avbilda konsekventa mönster. När den läggs till extraheras all text som matchar det reguljära uttrycket. Du kan ha flera reguljära uttryck inom samma entitet, var och en med en annan nyckelidentifierare. Ett matchat uttryck returnerar nyckeln som en del av förutsägelsesvaret.

I flerspråkiga projekt kan du ange ett annat uttryck för varje språk. När du använder förutsägelse-API:et kan du ange språket i indatabegäran, som endast matchar det reguljära uttryck som är associerat med det språket.

Skärmbild som visar ett exempel på regex-komponenter för entiteter.

Entitetsalternativ

När flera komponenter har definierats för en entitet kan deras förutsägelser överlappa varandra. När en överlappning inträffar bestäms varje entitets slutliga förutsägelse av något av följande alternativ.

Kombinera komponenter

Kombinera komponenter som en entitet när de överlappar varandra genom att ta union av alla komponenter.

Använd det här alternativet om du vill kombinera alla komponenter när de överlappar varandra. När komponenter kombineras får du all extra information som är kopplad till en lista eller en fördefinierad komponent när de finns.

Exempel

Anta att du har en entitet med namnet Programvara som har en listkomponent som innehåller "Proseware OS" som en post. I dina yttranden har du "Jag vill köpa Proseware OS 9" med "Proseware OS 9" taggad som Programvara:

Skärmbild som visar en inlärd och listad entitet överlappad.

Med hjälp av kombinerade komponenter returnerar entiteten med den fullständiga kontexten "Proseware OS 9" tillsammans med nyckeln från listkomponenten:

Skärmbild som visar resultatet av en kombinerad komponent.

Anta att du hade samma yttrande, men endast "OS 9" förutsades av den inlärda komponenten:

Skärmbild som visar ett yttrande med O S 9 som förutsägs av den inlärda komponenten.

Med kombinerade komponenter returnerar entiteten fortfarande som "Proseware OS 9" med nyckeln från listkomponenten:

Skärmbild som visar den returnerade programvaruentiteten.

Kombinera inte komponenter

Varje överlappande komponent returneras som en separat instans av entiteten. Använd din egen logik efter förutsägelse med det här alternativet.

Exempel

Anta att du har en entitet med namnet Programvara som har en listkomponent som innehåller "Proseware Desktop" som en post. I dina yttranden har du "Jag vill köpa Proseware Desktop Pro" med "Proseware Desktop Pro" taggad som Programvara:

Skärmbild som visar ett exempel på en inlärd och listad entitet överlappade.

När du inte kombinerar komponenter returnerar entiteten två gånger:

Skärmbild som visar entiteten som returneras två gånger.

Nödvändiga komponenter

Ibland kan en entitet definieras av flera komponenter men kräver att en eller flera av dem finns. Varje komponent kan anges efter behov, vilket innebär att entiteten inte returneras om komponenten inte fanns. Om du till exempel har en entitet med en listkomponent och en nödvändig inlärd komponent garanteras att en returnerad entitet innehåller en inlärd komponent. Om den inte gör det returneras inte entiteten.

Nödvändiga komponenter används oftast med inlärda komponenter eftersom de kan begränsa de andra komponenttyperna till en specifik kontext, som ofta är associerad med roller. Du kan också kräva att alla komponenter ser till att varje komponent finns för en entitet.

I Language Studio har varje komponent i en entitet en växlingsknapp bredvid den som gör att du kan ange den efter behov.

Exempel

Anta att du har en entitet med namnet Ticket Quantity som försöker extrahera det antal biljetter som du vill reservera för flyg, för yttranden som "Boka två biljetter i morgon till Kairo".

Vanligtvis lägger du till en fördefinierad komponent för Quantity.Number som redan extraherar alla tal. Om din entitet bara har definierats med den fördefinierade komponenten extraherar den även andra nummer som en del av entiteten Biljettkvantitet , till exempel "Boka två biljetter i morgon till Kairo kl . 15.00 ".

För att lösa det här scenariot kan du märka en inlärd komponent i dina träningsdata för alla tal som är avsedda att vara biljettkvantitet. Entiteten har nu två komponenter: den fördefinierade komponenten som känner till alla tal och den inlärda som förutsäger var biljettkvantiteten finns i en mening. Om du behöver den inlärda komponenten kontrollerar du att Biljettkvantitet endast returneras när den inlärda komponenten förutsäger den i rätt kontext. Om du också behöver den fördefinierade komponenten kan du garantera att den returnerade entiteten Biljettkvantitet är både ett tal och i rätt position.

Använda komponenter och alternativ

Komponenter ger dig flexibiliteten att definiera entiteten på mer än ett sätt. När du kombinerar komponenter ser du till att varje komponent representeras och minskar antalet entiteter som returneras i dina förutsägelser.

En vanlig metod är att utöka en fördefinierad komponent med en lista med värden som den fördefinierade kanske inte stöder. Om du till exempel har en organisationsentitet, som har en General.Organization fördefinierad komponent tillagd, kanske entiteten inte förutsäger alla organisationer som är specifika för din domän. Du kan använda en listkomponent för att utöka värdena för entiteten Organisation och utöka den fördefinierade komponenten med dina egna organisationer.

Andra gånger kan du vara intresserad av att extrahera en entitet via kontext, till exempel en produkt i ett detaljhandelsprojekt. Du märker den inlärda komponenten i produkten för att lära dig var en produkt baseras på dess position i meningen. Du kan också ha en lista över produkter som du redan vet i förväg som du alltid vill extrahera. Genom att kombinera båda komponenterna i en entitet kan du hämta båda alternativen för entiteten.

När du inte kombinerar komponenter låter du varje komponent fungera som en oberoende entitetsextraktor. Ett sätt att använda det här alternativet är att separera de entiteter som extraheras från en lista till de som extraheras via de inlärda eller fördefinierade komponenterna för att hantera och behandla dem på olika sätt.

Kommentar

Tidigare under den offentliga förhandsversionen av tjänsten fanns det fyra tillgängliga alternativ: Längst överlappning, Exakt överlappning, Union-överlappning och Retur separat. Längst överlappning och Exakt överlappning är inaktuella och stöds endast för projekt som tidigare hade valt dessa alternativ. Union överlappning har bytt namn till Kombinera komponenter, medan Returnera alla separat har bytt namn till Kombinera inte komponenter.