Så här använder du namngiven entitetsigenkänning (NER)
FUNKTIONEN NER kan utvärdera ostrukturerad text och extrahera namngivna entiteter från text i flera fördefinierade kategorier, till exempel person, plats, händelse, produkt och organisation.
Utvecklingsalternativ
Om du vill använda namngiven entitetsigenkänning skickar du ostrukturerad ostrukturerad text för analys och hanterar API-utdata i ditt program. Analysen utförs som den är, utan ytterligare anpassning till den modell som används för dina data. Det finns två sätt att använda namngiven entitetsigenkänning:
Utvecklingsalternativ | beskrivning |
---|---|
Language Studio | Language Studio är en webbaserad plattform där du kan prova entitetslänkning med textexempel utan ett Azure-konto och dina egna data när du registrerar dig. Mer information finns på Language Studio-webbplatsen eller language studio-snabbstarten. |
REST API eller klientbibliotek (Azure SDK) | Integrera namngiven entitetsigenkänning i dina program med hjälp av REST-API:et eller klientbiblioteket som är tillgängligt på flera olika språk. Mer information finns i snabbstarten för namngiven entitetsigenkänning. |
Bestämma hur data ska bearbetas (valfritt)
Indataspråk
När du skickar dokument som ska bearbetas kan du ange vilket av de språk som stöds som de är skrivna i. Om du inte anger något språk kan du som standard använda extrahering av nyckelfraser på engelska. API:et kan returnera förskjutningar i svaret för att stödja olika flerspråkiga kodningar och emojikodningar.
Skicka data
Analysen utförs när begäran har tagits emot. Användning av NER-funktionen är synkront tillståndslös. Inga data lagras i ditt konto och resultatet returneras omedelbart i svaret.
När du använder den här funktionen asynkront är API-resultaten tillgängliga i 24 timmar från den tidpunkt då begäran matades in och anges i svaret. Efter den här tidsperioden rensas resultaten och är inte längre tillgängliga för hämtning.
API:et försöker identifiera de definierade entitetskategorierna för ett visst dokumentspråk.
Hämta NER-resultat
När du får resultat från NER kan du strömma resultatet till ett program eller spara utdata till en fil i det lokala systemet. API-svaret innehåller identifierade entiteter, inklusive deras kategorier och underkategorier, samt konfidenspoäng.
Välj vilka entiteter som ska returneras
API:et försöker identifiera de definierade entitetstyperna och taggarna för ett visst dokumentspråk. Entitetstyperna och taggarna ersätter de kategorier och underkategorier som de äldre modellerna använder för att definiera entiteter för mer flexibilitet. Du kan också ange vilka entiteter som identifieras och returneras, använda valfria includeList
och excludeList
parametrar med lämpliga entitetstyper. I följande exempel identifieras endast Location
. Du kan ange en eller flera entitetstyper som ska returneras. Med tanke på den typ- och taggarhierarki som introducerades för den här versionen har du flexibiliteten att filtrera på olika kornighetsnivåer så här:
Inmatning:
Kommentar
I det här exemplet returneras endast entitetstypen "Plats" .
{
"kind": "EntityRecognition",
"parameters":
{
"includeList" :
[
"Location"
]
},
"analysisInput":
{
"documents":
[
{
"id":"1",
"language": "en",
"text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
}
]
}
}
Ovanstående exempel returnerar entiteter som faller under Location
entitetstypen, till GPE
exempel , Structural
och Geological
taggade entiteter enligt beskrivningen av entitetstyper och taggar. Vi kan också ytterligare filtrera de returnerade entiteterna genom att filtrera med någon av entitetstaggar för Location
entitetstypen, till exempel filtrering över GPE
tagg endast enligt beskrivningen:
"parameters":
{
"includeList" :
[
"GPE"
]
}
Den här metoden returnerar alla Location
entiteter som bara faller under taggen GPE
och ignorerar alla andra entiteter som faller under den Location
typ som taggas med andra entitetstagg som Structural
eller Geological
taggade entiteter Location
. Vi kan också öka detaljnivån ytterligare på våra resultat med hjälp av parametern excludeList
. GPE
taggade entiteter kan taggas med följande taggar: City
, State
, CountryRegion
, . Continent
Vi kan till exempel exkludera Continent
och CountryRegion
taggar för vårt exempel:
"parameters":
{
"includeList" :
[
"GPE"
],
"excludeList": :
[
"Continent",
"CountryRegion"
]
}
Med hjälp av dessa parametrar kan vi bara Location
filtrera på entitetstyper, eftersom GPE
entitetstaggen som ingår i parametern includeList
faller under Location
typen. Sedan filtrerar vi endast på geopolitiska entiteter och exkluderar alla entiteter som taggats med Continent
eller CountryRegion
taggar.
Ytterligare utdataattribut
För att ge användarna mer insikt i en entitets typer och ge ökad användbarhet stöder NER dessa attribut i utdata:
Namnet på attributet | Type | Definition |
---|---|---|
type |
String | Den mest specifika typen av identifierad entitet. Till exempel är "Seattle" en City , en GPE (geo politisk entitet) och en Location . Den mest detaljerade klassificeringen för "Seattle" är att det är en City . Typen skulle vara City för texten "Seattle". |
tags |
Lista (taggar) | En lista över taggobjekt som uttrycker tillhörigheten för den identifierade entiteten till en hierarki eller någon annan gruppering. En tagg innehåller två fält: 1. name : Ett unikt namn för taggen.2. confidenceScore : Den associerade konfidenspoängen för en tagg som sträcker sig från 0 till 1.Den här unika tagName används för att filtrera i parametrarna inclusionList och exclusionList . |
metadata |
Objekt | Metadata är ett objekt som innehåller mer data om den identifierade entitetstypen. Den ändras baserat på fältet metadataKind . |
Exempelutdata
Det här exempelutdata innehåller ett exempel på de ytterligare utdataattributen.
{
"kind": "EntityRecognitionResults",
"results": {
"documents": [
{
"id": "1",
"entities": [
{
"text": "Microsoft",
"category": "Organization",
"type": "Organization",
"offset": 0,
"length": 9,
"confidenceScore": 0.97,
"tags": [
{
"name": "Organization",
"confidenceScore": 0.97
}
]
},
{
"text": "One",
"category": "Quantity",
"type": "Number",
"subcategory": "Number",
"offset": 21,
"length": 3,
"confidenceScore": 0.9,
"tags": [
{
"name": "Number",
"confidenceScore": 0.8
},
{
"name": "Quantity",
"confidenceScore": 0.8
},
{
"name": "Numeric",
"confidenceScore": 0.8
}
],
"metadata": {
"metadataKind": "NumberMetadata",
"numberKind": "Integer",
"value": 1.0
}
}
],
"warnings": []
}
],
"errors": [],
"modelVersion": "2023-09-01"
}
}
Ange NER-modellen
Som standard använder den här funktionen den senaste tillgängliga AI-modellen i din text. Du kan också konfigurera dina API-begäranden att använda en specifik modellversion.
Tjänst- och datagränser
Information om storleken och antalet begäranden som du kan skicka per minut och sekund finns i artikeln om tjänstbegränsningar .