Sdílet prostřednictvím


Kognitivní dovednost Propojování entit (v3)

Dovednost Entity Linking (v3) vrátí seznam rozpoznaných entit s odkazy na články v dobře známém znalostní báze (Wikipedie).

Poznámka:

Tato dovednost je vázána na modely strojového učení Entity Linking v Azure AI Language a vyžaduje fakturovatelný prostředek pro transakce, které překračují 20 dokumentů na indexer za den. Provádění integrovaných dovedností se účtuje za stávající cenu průběžných plateb za služby Azure AI.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

Omezení dat

Maximální velikost záznamu by měla být 50 000 znaků měřená String.Lengthhodnotou . Pokud potřebujete data před odesláním do dovednosti EntityLinking rozdělit, zvažte použití dovednosti Rozdělení textu. Pokud používáte dovednost rozdělení textu, nastavte délku stránky na 5 000 pro nejlepší výkon.

Parametry dovedností

V názvech parametrů se rozlišují malá a velká písmena a všechny jsou volitelné.

Název parametru Popis
defaultLanguageCode Kód jazyka vstupního textu Pokud není zadaný výchozí kód jazyka, použije se angličtina (en) jako výchozí kód jazyka.
Projděte si kompletní seznam podporovaných jazyků.
minimumPrecision Hodnota mezi 0 a 1. Pokud je skóre spolehlivosti (ve výstupu entities ) nižší než tato hodnota, entita se nevrátí. Výchozí hodnota je 0.
modelVersion (Volitelné) Určuje verzi modelu, která se má použít při volání propojení entit. Pokud není zadaný, nastaví se výchozí hodnota na nejnovější dostupnou. Tuto hodnotu doporučujeme nezadávat, pokud není nutná.

Vstupy dovedností

Název vstupu Popis
languageCode Řetězec označující jazyk záznamů. Pokud tento parametr není zadaný, použije se k analýze záznamů výchozí kód jazyka.
Projděte si kompletní seznam podporovaných jazyků.
text Text, který chcete analyzovat.

Výstupy dovedností

Název výstupu Popis
entities Pole komplexních typů, které obsahuje následující pole:
  • "name" (Skutečný název entity, jak se zobrazí v textu)
  • "id"
  • "language" (Jazyk textu určený dovedností)
  • "url" (Propojená adresa URL této entity)
  • "bingId" (ID bingu pro tuto propojenou entitu)
  • "dataSource" (Zdroj dat přidružený k adrese URL)
  • "matches"(Pole komplexních typů, které obsahují: text, offsetlength a confidenceScore)

Ukázková definice

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

Ukázkový vstup

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

Ukázkový výstup

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

Posuny vrácené entitami ve výstupu této dovednosti se vrátí přímo z rozhraní API služby jazyka, což znamená, že pokud je používáte k indexování do původního řetězce, měli byste k extrahování správného obsahu použít třídu StringInfo v .NET. Další informace najdete v tématu Podpora vícejazyčných a emoji ve funkcích služby Jazyk.

Případy upozornění

Pokud kód jazyka dokumentu není podporován, vrátí se upozornění a nebudou extrahovány žádné entity.

Viz také