Namngiven kognitiv färdighet för entitetsigenkänning (v2)
Färdigheten Namngiven entitetsigenkänning (v2) extraherar namngivna entiteter från text. Tillgängliga entiteter inkluderar typerna person
, location
och organization
.
Viktigt!
Namngiven entitetsigenkänningsfärdighet (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) ersätts nu av Microsoft.Skills.Text.V3.EntityRecognitionSkill. Följ rekommendationerna i Inaktuella Azure AI Search-kunskaper för att migrera till en kompetens som stöds.
Kommentar
När du utökar omfånget genom att öka bearbetningsfrekvensen, lägga till fler dokument eller lägga till fler AI-algoritmer måste du bifoga en fakturerbar Azure AI-tjänstresurs. Avgifter tillkommer när API:er anropas i Azure AI-tjänster och för extrahering av bilder som en del av dokumentknäckningssteget i Azure AI Search. Det finns inga avgifter för textextrahering från dokument. Körning av inbyggda kunskaper debiteras enligt det befintliga priset för Betala per användning för Azure AI-tjänster.
Bildextrahering är en extra avgift som mäts av Azure AI Search, enligt beskrivningen på prissidan. Extrahering av text är kostnadsfri.
@odata.type
Microsoft.Skills.Text.NamedEntityRecognitionSkill
Databegränsningar
Den maximala storleken på en post ska vara 50 000 tecken mätt med String.Length
. Om du behöver dela upp dina data innan du skickar dem till nyckelfrasextraktorn bör du överväga att använda färdigheten Textdelning. Om du använder en textdelningsfärdighet anger du sidlängden till 5 000 för bästa prestanda.
Kompetensparametrar
Parametrar är skiftlägeskänsliga.
Parameternamn | beskrivning |
---|---|
kategorier | Matris med kategorier som ska extraheras. Möjliga kategorityper: "Person" , "Location" , "Organization" . Om ingen kategori anges returneras alla typer. |
defaultLanguageCode | Språkkod för indatatexten. Följande språk stöds: de, en, es, fr, it |
minimumPrecision | Ett tal mellan 0 och 1. Om precisionen är lägre än det här värdet returneras inte entiteten. Standardvärdet är 0. |
Kunskapsindata
Indatanamn | beskrivning |
---|---|
languageCode | Valfritt. Standard är "en" . |
text | Texten som ska analyseras. |
Kunskapsutdata
Utdatanamn | beskrivning |
---|---|
personer | En matris med strängar där varje sträng representerar namnet på en person. |
platser | En matris med strängar där varje sträng representerar en plats. |
organisationer | En matris med strängar där varje sträng representerar en organisation. |
entiteter | En matris med komplexa typer. Varje komplex typ innehåller följande fält:
|
Exempeldefinition
{
"@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
"categories": [ "Person", "Location", "Organization"],
"defaultLanguageCode": "en",
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "persons",
"targetName": "people"
}
]
}
Exempelindata
{
"values": [
{
"recordId": "1",
"data":
{
"text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
"languageCode": "en"
}
}
]
}
Exempelutdata
{
"values": [
{
"recordId": "1",
"data" :
{
"persons": [ "Joe Romero", "Ana Smith"],
"locations": ["Chile", "Australia"],
"organizations":["Microsoft"],
"entities":
[
{
"category":"person",
"value": "Joe Romero",
"offset": 33,
"confidence": 0.87
},
{
"category":"person",
"value": "Ana Smith",
"offset": 124,
"confidence": 0.87
},
{
"category":"location",
"value": "Chile",
"offset": 88,
"confidence": 0.99
},
{
"category":"location",
"value": "Australia",
"offset": 112,
"confidence": 0.99
},
{
"category":"organization",
"value": "Microsoft",
"offset": 54,
"confidence": 0.99
}
]
}
}
]
}
Varningsfall
Om språkkoden för dokumentet inte stöds returneras en varning och inga entiteter extraheras.