Så här använder du namngiven entitetsigenkänning (NER)

Artikel
02/25/2025

FUNKTIONEN NER kan utvärdera ostrukturerad text och extrahera namngivna entiteter från text i flera fördefinierade kategorier, till exempel person, plats, händelse, produkt och organisation.

Utvecklingsalternativ

Om du vill använda namngiven entitetsigenkänning skickar du ostrukturerad ostrukturerad text för analys och hanterar API-utdata i ditt program. Analysen utförs som den är, utan ytterligare anpassning till den modell som används för dina data. Det finns två sätt att använda namngiven entitetsigenkänning:

Utvecklingsalternativ	beskrivning
Azure AI Foundry	Azure AI Foundry är en webbaserad plattform där du kan använda namngiven entitetsigenkänning med textexempel med dina egna data när du registrerar dig. Mer information finns i dokumentationen om Azure AI Foundry eller Azure AI Foundry.
REST API eller klientbibliotek (Azure SDK)	Integrera namngiven entitetsigenkänning i dina program med hjälp av REST-API:et eller klientbiblioteket som är tillgängligt på flera olika språk. Mer information finns i snabbstarten för namngiven entitetsigenkänning.

Bestämma hur data ska bearbetas (valfritt)

Indataspråk

När du skickar indatatext som ska bearbetas kan du ange vilket av de språk som stöds som de är skrivna i. Om du inte anger något språk är extrahering av nyckelfraser standardvärdet engelska. API:et kan returnera förskjutningar i svaret för att stödja olika flerspråkiga kodningar och emojikodningar.

Skicka data

Analysen utförs när begäran har tagits emot. Användning av NER-funktionen är synkront tillståndslös. Inga data lagras i ditt konto och resultatet returneras omedelbart i svaret.

När du använder den här funktionen asynkront är API-resultaten tillgängliga i 24 timmar från den tidpunkt då begäran matades in och anges i svaret. Efter den här tidsperioden rensas resultaten och är inte längre tillgängliga för hämtning.

API:et försöker identifiera de definierade entitetskategorierna för ett visst textspråk för indata.

Hämta NER-resultat

När du får resultat från NER kan du strömma resultatet till ett program eller spara utdata till en fil i det lokala systemet. API-svaret innehåller identifierade entiteter, inklusive deras kategorier och underkategorier, samt konfidenspoäng.

Välj vilka entiteter som ska returneras

API:et försöker identifiera de definierade entitetstyperna och taggarna för ett visst textspråk för indata. Entitetstyperna och taggarna ersätter de kategorier och underkategorier som de äldre modellerna använder för att definiera entiteter för mer flexibilitet. Du kan också ange vilka entiteter som identifieras och returneras, använda valfria includeList och excludeList parametrar med lämpliga entitetstyper. I följande exempel identifieras endast Location. Du kan ange en eller flera entitetstyper som ska returneras. Med tanke på den typ- och taggarhierarki som introducerades för den här versionen har du flexibiliteten att filtrera på olika kornighetsnivåer så här:

Inmatning:

Kommentar

I det här exemplet returneras endast entitetstypen "Plats" .

{
    "kind": "EntityRecognition",
    "parameters": 
    {
        "includeList" :
        [
            "Location"
        ]
    },
    "analysisInput":
    {
        "documents":
        [
            {
                "id":"1",
                "language": "en",
                "text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
            }
        ]
    }
}

Ovanstående exempel returnerar entiteter som faller under Location entitetstypen, till GPEexempel , Structuraloch Geological taggade entiteter enligt beskrivningen av entitetstyper och taggar. Vi kan också ytterligare filtrera de returnerade entiteterna genom att filtrera med någon av entitetstaggar för Location entitetstypen, till exempel filtrering över GPE tagg endast enligt beskrivningen:


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ]
    }

Den här metoden returnerar alla Location entiteter som bara faller under taggen GPE och ignorerar alla andra entiteter som faller under den Location typ som taggas med andra entitetstagg som Structural eller Geological taggade entiteter Location . Vi kan också öka detaljnivån ytterligare på våra resultat med hjälp av parametern excludeList . GPEtaggade entiteter kan taggas med följande taggar: City, State, CountryRegion, . Continent Vi kan till exempel exkludera Continent och CountryRegion taggar för vårt exempel:


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ],
        "excludeList": :
        [
            "Continent",
            "CountryRegion"
        ]
    }

Med hjälp av dessa parametrar kan vi bara Location filtrera på entitetstyper, eftersom GPE entitetstaggen som ingår i parametern includeList faller under Location typen. Sedan filtrerar vi endast på geopolitiska entiteter och exkluderar alla entiteter som taggats med Continent eller CountryRegion taggar.

Ytterligare utdataattribut

För att ge användarna mer insikt i en entitets typer och ge ökad användbarhet stöder NER dessa attribut i utdata:

Namnet på attributet	Type	Definition
`type`	String	Den mest specifika typen av identifierad entitet. Till exempel är "Seattle" en `City`, en `GPE` (geo politisk entitet) och en `Location`. Den mest detaljerade klassificeringen för "Seattle" är att det är en `City`. Typen skulle vara `City` för texten "Seattle".
`tags`	Lista (taggar)	En lista över taggobjekt som uttrycker tillhörigheten för den identifierade entiteten till en hierarki eller någon annan gruppering. En tagg innehåller två fält: 1. `name`: Ett unikt namn för taggen. 2. `confidenceScore`: Den associerade konfidenspoängen för en tagg som sträcker sig från 0 till 1. Det här unika tagName används för att filtrera i parametrarna `inclusionList` och `exclusionList` .
`metadata`	Objekt	Metadata är ett objekt som innehåller mer data om den identifierade entitetstypen. Den ändras baserat på fältet `metadataKind`.

Exempelutdata

Det här exempelutdata innehåller ett exempel på de ytterligare utdataattributen.

{ 
    "kind": "EntityRecognitionResults", 
    "results": { 
        "documents": [ 
            { 
                "id": "1", 
                "entities": [ 
                    { 
                        "text": "Microsoft", 
                        "category": "Organization", 
                        "type": "Organization", 
                        "offset": 0, 
                        "length": 9, 
                        "confidenceScore": 0.97, 
                        "tags": [ 
                            { 
                                "name": "Organization", 
                                "confidenceScore": 0.97 
                            } 
                        ] 
                    }, 
                    { 
                        "text": "One", 
                        "category": "Quantity", 
                        "type": "Number", 
                        "subcategory": "Number", 
                        "offset": 21, 
                        "length": 3, 
                        "confidenceScore": 0.9, 
                        "tags": [ 
                            { 
                                "name": "Number", 
                                "confidenceScore": 0.8 
                            }, 
                            { 
                                "name": "Quantity", 
                                "confidenceScore": 0.8 
                            }, 
                            { 
                                "name": "Numeric", 
                                "confidenceScore": 0.8 
                            } 
                        ], 
                        "metadata": { 
                            "metadataKind": "NumberMetadata", 
                            "numberKind": "Integer", 
                            "value": 1.0 
                        } 
                    } 
                ], 
                "warnings": [] 
            } 
        ], 
        "errors": [], 
        "modelVersion": "2023-09-01" 
    } 
}

Ange NER-modellen

Som standard använder den här funktionen den senaste tillgängliga AI-modellen i din text. Du kan också konfigurera dina API-begäranden att använda en specifik modellversion.

Tjänst- och datagränser

Information om storleken och antalet begäranden som du kan skicka per minut och sekund finns i artikeln om tjänstbegränsningar .

Nästa steg

Översikt över namngiven entitetsigenkänning

Dela via