Delen via


NER (Named Entity Recognition) gebruiken

De NER-functie kan ongestructureerde tekst evalueren en benoemde entiteiten extraheren uit tekst in verschillende vooraf gedefinieerde categorieën, bijvoorbeeld: persoon, locatie, gebeurtenis, product en organisatie.

Ontwikkelingsopties

Als u herkenning van benoemde entiteiten wilt gebruiken, verzendt u onbewerkte ongestructureerde tekst voor analyse en verwerkt u de API-uitvoer in uw toepassing. Analyse wordt uitgevoerd als zodanig, zonder extra aanpassingen aan het model dat op uw gegevens wordt gebruikt. Er zijn twee manieren om benoemde entiteitsherkenning te gebruiken:

Ontwikkelingsoptie Beschrijving
Taalstudio Language Studio is een webplatform waarmee u entiteitskoppelingen kunt proberen met tekstvoorbeelden zonder een Azure-account en uw eigen gegevens wanneer u zich aanmeldt. Zie de quickstart voor Language Studio of Language Studio voor meer informatie.
REST API of clientbibliotheek (Azure SDK) Integreer benoemde entiteitsherkenning in uw toepassingen met behulp van de REST API of de clientbibliotheek die beschikbaar is in verschillende talen. Zie de quickstart voor herkenning van benoemde entiteiten voor meer informatie.

Bepalen hoe de gegevens moeten worden verwerkt (optioneel)

Invoertalen

Wanneer u documenten verzendt die moeten worden verwerkt, kunt u opgeven in welke van de ondersteunde talen ze zijn geschreven. Als u geen taal opgeeft, worden standaard sleuteltermextracties standaard ingesteld op Engels. De API retourneert mogelijk offsets in het antwoord ter ondersteuning van verschillende meertalige en emoji-coderingen.

Gegevens verzenden

Analyse wordt uitgevoerd na ontvangst van de aanvraag. Het gebruik van de NER-functie is synchroon staatloos. Er worden geen gegevens in uw account opgeslagen en de resultaten worden onmiddellijk in het antwoord geretourneerd.

Wanneer u deze functie asynchroon gebruikt, zijn de API-resultaten gedurende 24 uur beschikbaar vanaf het moment dat de aanvraag is opgenomen en wordt aangegeven in het antwoord. Na deze periode worden de resultaten opgeschoond en zijn ze niet meer beschikbaar voor het ophalen.

De API probeert de gedefinieerde entiteitscategorieën voor een bepaalde documenttaal te detecteren.

NER-resultaten ophalen

Wanneer u resultaten van NER krijgt, kunt u de resultaten streamen naar een toepassing of de uitvoer opslaan in een bestand op het lokale systeem. Het API-antwoord bevat herkende entiteiten, inclusief hun categorieën en subcategorieën en betrouwbaarheidsscores.

Selecteren welke entiteiten moeten worden geretourneerd

De API probeert de gedefinieerde entiteitstypen en tags voor een bepaalde documenttaal te detecteren. De entiteitstypen en tags vervangen de categorieën en subcategorieënstructuur die de oudere modellen gebruiken om entiteiten te definiëren voor meer flexibiliteit. U kunt ook opgeven welke entiteiten worden gedetecteerd en geretourneerd, de optionele includeList en excludeList parameters gebruiken met de juiste entiteitstypen. In het volgende voorbeeld wordt alleen Locationgedetecteerd. U kunt een of meer entiteitstypen opgeven die moeten worden geretourneerd. Gezien de typen en tagshiërarchie die voor deze versie is geïntroduceerd, hebt u de flexibiliteit om te filteren op verschillende granulariteitsniveaus als volgt:

Input:

Notitie

In dit voorbeeld wordt alleen het entiteitstype Locatie geretourneerd.

{
    "kind": "EntityRecognition",
    "parameters": 
    {
        "includeList" :
        [
            "Location"
        ]
    },
    "analysisInput":
    {
        "documents":
        [
            {
                "id":"1",
                "language": "en",
                "text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
            }
        ]
    }
}

In de bovenstaande voorbeelden worden entiteiten geretourneerd die onder het Location entiteitstype vallen, zoals de GPE, Structuralen Geological gelabelde entiteiten, zoals beschreven door entiteitstypen en tags. We kunnen de geretourneerde entiteiten ook verder filteren door te filteren met behulp van een van de entiteitstags voor het Location entiteitstype, zoals filteren op GPE tag alleen zoals wordt beschreven:


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ]
    }
    

Deze methode retourneert alle Location entiteiten die alleen onder de GPE tag vallen en negeer alle andere entiteiten die onder het Location type vallen dat is getagd met een andere entiteitstag, zoals Structural of Geological gelabelde Location entiteiten. We kunnen ook verder inzoomen op onze resultaten met behulp van de excludeList parameter. GPEgelabelde entiteiten kunnen worden gelabeld met de volgende tags: City, State, CountryRegion, . Continent We kunnen bijvoorbeeld uitsluiten en CountryRegion tags voor Continent ons voorbeeld:


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ],
        "excludeList": :
        [
            "Continent",
            "CountryRegion"
        ]
    }
    

Met deze parameters kunnen we filteren op alleen Location entiteitstypen, omdat de GPE entiteitstag die in de includeList parameter is opgenomen, onder het Location type valt. Vervolgens filteren we op alleen geopolitieke entiteiten en sluiten we alle entiteiten uit die zijn getagd met Continent of CountryRegion tags.

Aanvullende uitvoerkenmerken

Om gebruikers meer inzicht te geven in de typen van een entiteit en betere bruikbaarheid te bieden, ondersteunt NER deze kenmerken in de uitvoer:

Naam van het kenmerk Type Definitie
type String Het meest specifieke type gedetecteerde entiteit.

Bijvoorbeeld: 'Seattle' is een City, een GPE (geo politieke entiteit) en een Location. De meest gedetailleerde classificatie voor "Seattle" is dat het een City. Het type is City voor de tekst 'Seattle'.
tags Lijst (tags) Een lijst met tagobjecten die de affiniteit van de gedetecteerde entiteit tot een hiërarchie of een andere groepering uitdrukken.

Een tag bevat twee velden:
1. name: Een unieke naam voor de tag.
2. confidenceScore: De bijbehorende betrouwbaarheidsscore voor een tag van 0 tot 1.

Deze unieke tagName wordt gebruikt om te filteren in de inclusionList en exclusionList parameters.
metadata Object Metagegevens zijn een object met meer gegevens over het gedetecteerde entiteitstype. Het verandert op basis van het veld metadataKind.

Voorbeelduitvoer

Deze voorbeelduitvoer bevat een voorbeeld van de aanvullende uitvoerkenmerken.

{ 
    "kind": "EntityRecognitionResults", 
    "results": { 
        "documents": [ 
            { 
                "id": "1", 
                "entities": [ 
                    { 
                        "text": "Microsoft", 
                        "category": "Organization", 
                        "type": "Organization", 
                        "offset": 0, 
                        "length": 9, 
                        "confidenceScore": 0.97, 
                        "tags": [ 
                            { 
                                "name": "Organization", 
                                "confidenceScore": 0.97 
                            } 
                        ] 
                    }, 
                    { 
                        "text": "One", 
                        "category": "Quantity", 
                        "type": "Number", 
                        "subcategory": "Number", 
                        "offset": 21, 
                        "length": 3, 
                        "confidenceScore": 0.9, 
                        "tags": [ 
                            { 
                                "name": "Number", 
                                "confidenceScore": 0.8 
                            }, 
                            { 
                                "name": "Quantity", 
                                "confidenceScore": 0.8 
                            }, 
                            { 
                                "name": "Numeric", 
                                "confidenceScore": 0.8 
                            } 
                        ], 
                        "metadata": { 
                            "metadataKind": "NumberMetadata", 
                            "numberKind": "Integer", 
                            "value": 1.0 
                        } 
                    } 
                ], 
                "warnings": [] 
            } 
        ], 
        "errors": [], 
        "modelVersion": "2023-09-01" 
    } 
} 

Het NER-model opgeven

Deze functie maakt standaard gebruik van het meest recente beschikbare AI-model op uw tekst. U kunt uw API-aanvragen ook configureren voor het gebruik van een specifieke modelversie.

Service- en gegevenslimieten

Zie het artikel over servicelimieten voor informatie over de grootte en het aantal aanvragen dat u per minuut en seconde kunt verzenden.

Volgende stappen

Overzicht van benoemde entiteitsherkenning