Namngiven kognitiv färdighet för entitetsigenkänning (v2)

Artikel
09/01/2024

Färdigheten Namngiven entitetsigenkänning (v2) extraherar namngivna entiteter från text. Tillgängliga entiteter inkluderar typerna person, location och organization.

Viktigt!

Namngiven entitetsigenkänningsfärdighet (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) ersätts nu av Microsoft.Skills.Text.V3.EntityRecognitionSkill. Följ rekommendationerna i Inaktuella Azure AI Search-kunskaper för att migrera till en kompetens som stöds.

Kommentar

När du utökar omfånget genom att öka bearbetningsfrekvensen, lägga till fler dokument eller lägga till fler AI-algoritmer måste du bifoga en fakturerbar Azure AI-tjänstresurs. Avgifter tillkommer när API:er anropas i Azure AI-tjänster och för extrahering av bilder som en del av dokumentknäckningssteget i Azure AI Search. Det finns inga avgifter för textextrahering från dokument. Körning av inbyggda kunskaper debiteras enligt det befintliga priset för Betala per användning för Azure AI-tjänster.

Bildextrahering är en extra avgift som mäts av Azure AI Search, enligt beskrivningen på prissidan. Extrahering av text är kostnadsfri.

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

Databegränsningar

Den maximala storleken på en post ska vara 50 000 tecken mätt med String.Length. Om du behöver dela upp dina data innan du skickar dem till nyckelfrasextraktorn bör du överväga att använda färdigheten Textdelning. Om du använder en textdelningsfärdighet anger du sidlängden till 5 000 för bästa prestanda.

Kompetensparametrar

Parametrar är skiftlägeskänsliga.

Parameternamn	beskrivning
kategorier	Matris med kategorier som ska extraheras. Möjliga kategorityper: `"Person"`, `"Location"`, `"Organization"`. Om ingen kategori anges returneras alla typer.
defaultLanguageCode	Språkkod för indatatexten. Följande språk stöds: `de, en, es, fr, it`
minimumPrecision	Ett tal mellan 0 och 1. Om precisionen är lägre än det här värdet returneras inte entiteten. Standardvärdet är 0.

Kunskapsindata

Indatanamn	beskrivning
languageCode	Valfritt. Standard är `"en"`.
text	Texten som ska analyseras.

Kunskapsutdata

Utdatanamn	beskrivning
personer	En matris med strängar där varje sträng representerar namnet på en person.
platser	En matris med strängar där varje sträng representerar en plats.
organisationer	En matris med strängar där varje sträng representerar en organisation.
entiteter	En matris med komplexa typer. Varje komplex typ innehåller följande fält: kategori (`"person"`, `"organization"`, eller `"location"`) värde (det faktiska entitetsnamnet) offset (Platsen där den hittades i texten) konfidens (ett värde mellan 0 och 1 som representerar det förtroendet för att värdet är en faktisk entitet)

Exempeldefinition

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

Exempelindata

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

Exempelutdata

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

Varningsfall

Om språkkoden för dokumentet inte stöds returneras en varning och inga entiteter extraheras.

Dela via