Kognitivní dovednost rozpoznávání pojmenovaných entit (v2)

Článek
09/01/2024

Dovednost rozpoznávání pojmenovaných entit (v2) extrahuje pojmenované entity z textu. Mezi dostupné entity patří typy personlocation a organization.

Důležité

Dovednost rozpoznávání pojmenovaných entit (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) je nyní ukončena nahrazením Microsoft.Skills.Text.V3.EntityRecognitionSkill. Pokud chcete migrovat na podporovanou dovednost, postupujte podle doporučení v zastaralých dovednostech služby Azure AI Search.

Poznámka:

Když rozšiřujete rozsah zvýšením frekvence zpracování, přidáním dalších dokumentů nebo přidáním dalších algoritmů AI, budete muset připojit fakturovatelný prostředek služeb Azure AI. Poplatky se účtují při volání rozhraní API ve službách Azure AI a extrakce obrázků v rámci fáze prolomení dokumentů ve službě Azure AI Search. Za extrakci textu z dokumentů se neúčtují žádné poplatky. Provádění integrovaných dovedností se účtuje za stávající cenu průběžných plateb za služby Azure AI.

Extrahování obrázků je dodatečné poplatky účtované službou Azure AI Search, jak je popsáno na stránce s cenami. Extrakce textu je volná.

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

Omezení dat

Maximální velikost záznamu by měla být 50 000 znaků měřená String.Lengthhodnotou . Pokud potřebujete data před odesláním do extraktoru klíčových frází rozdělit, zvažte použití dovednosti Rozdělení textu. Pokud používáte dovednost rozdělení textu, nastavte délku stránky na 5 000 pro nejlepší výkon.

Parametry dovedností

Parametry rozlišují malá a velká písmena.

Název parametru	Popis
categories	Pole kategorií, které by se měly extrahovat. Možné typy kategorií: `"Person"`, `"Location"`. `"Organization"` Pokud není k dispozici žádná kategorie, vrátí se všechny typy.
defaultLanguageCode	Kód jazyka vstupního textu Podporují se následující jazyky: `de, en, es, fr, it`
minimumPrecision	Číslo mezi 0 a 1. Pokud je přesnost nižší než tato hodnota, entita se nevrátí. Výchozí hodnota je 0.

Vstupy dovedností

Název vstupu	Popis
languageCode	Nepovinné. Výchozí hodnota je `"en"`.
text	Text, který chcete analyzovat.

Výstupy dovedností

Název výstupu	Popis
osoby	Pole řetězců, kde každý řetězec představuje jméno osoby.
umístění	Pole řetězců, kde každý řetězec představuje umístění.
organizations	Pole řetězců, ve kterých každý řetězec představuje organizaci.
entities	Pole komplexních typů. Každý komplexní typ obsahuje následující pole: kategorie (`"person"`, `"organization"`, nebo `"location"`) value (skutečný název entity) posun (umístění, kde byl nalezen v textu) confidence (Hodnota mezi 0 a 1, která představuje jistotu, že hodnota je skutečná entita)

Ukázková definice

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

Ukázkový vstup

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

Ukázkový výstup

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

Případy upozornění

Pokud kód jazyka dokumentu není podporován, vrátí se upozornění a nebudou extrahovány žádné entity.

Sdílet prostřednictvím