Competenza cognitiva di Entity Linking (v3)

Articolo
09/01/2024

La competenza Entity Linking (v3) restituisce un elenco di entità riconosciute con collegamenti ad articoli in una knowledge base nota (Wikipedia).

Nota

Questa competenza è associata ai modelli di Machine Learning Entity Linking nel linguaggio di intelligenza artificiale di Azure e richiede una risorsa fatturabile per le transazioni che superano 20 documenti per indicizzatore al giorno. L'esecuzione delle competenze predefinite viene addebitata secondo gli attuali prezzi con pagamento in base al consumo dei Servizi di Azure AI.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

Limiti dei dati

Le dimensioni massime di un record devono essere di 50.000 caratteri in base alla misurazione di String.Length. Se è necessario suddividere i dati prima di inviarli alla competenza EntityLinking, è consigliabile usare la competenza Suddivisione testo. Se si usa una competenza di suddivisione del testo, impostare la lunghezza della pagina su 5000 per ottenere prestazioni ottimali.

Parametri della competenza

I nomi dei parametri fanno distinzione tra maiuscole e minuscole e sono tutti facoltativi.

Nome parametro	Descrizione
`defaultLanguageCode`	Codice lingua del testo di input. Se il codice lingua predefinito non è specificato, Inglese (en) verrà usato come il codice lingua predefinito. Vedi l'elenco completo di linguaggi supportati.
`minimumPrecision`	Immettere un valore compreso tra 0 e 1. Se il punteggio di attendibilità (nell'output) è inferiore a questo valore, l'entità `entities` non viene restituita. Il valore predefinito è 0.
`modelVersion`	(Facoltativo) Specifica la versione del modello da usare quando si chiama il collegamento di entità. L'impostazione predefinita sarà la versione più recente disponibile se non specificata. È consigliabile non specificare questo valore a meno che non sia necessario.

Input competenze

Nome input	Descrizione
`languageCode`	Stringa che indica la lingua dei record. Se questo parametro viene omesso, il codice lingua predefinito verrà usato per analizzare i record. Vedi l'elenco completo di linguaggi supportati.
`text`	Testo da analizzare.

Output competenze

Nome output Descrizione

Nome output	Descrizione
`entities`	Matrice di tipi complessi che contiene i campi seguenti: `"name"` (Il nome effettivo dell'entità visualizzato nel testo) `"id"` `"language"` (Lingua del testo come determinato dalla competenza) `"url"` (URL collegato a questa entità) "`bingId`" (BingId per questa entità collegata) `"dataSource"` (Origine dati associata all'URL) `"matches"`(Matrice di tipi complessi che contiene: `text`, `offsetlength` e `confidenceScore`)

entities

Matrice di tipi complessi che contiene i campi seguenti:

"name" (Il nome effettivo dell'entità visualizzato nel testo)
"id"
"language" (Lingua del testo come determinato dalla competenza)
"url" (URL collegato a questa entità)
"bingId" (BingId per questa entità collegata)
"dataSource" (Origine dati associata all'URL)
"matches"(Matrice di tipi complessi che contiene: text, offsetlength e confidenceScore)

Definizione di esempio

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

Input di esempio

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

Output di esempio

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

Gli offset restituiti per le entità nell'output di questa competenza vengono restituiti direttamente dalle API del servizio di linguaggio, ovvero se vengono usate per indicizzare nella stringa originale, è consigliabile usare la classe StringInfo in .NET per estrarre il contenuto corretto. Per altre informazioni, vedere Supporto multilingue ed emoji nelle funzionalità del servizio di linguaggio.

Casi di avviso

Se il codice linguistico per il documento non è supportato, viene restituito un avviso e non vengono estratte entità.

Condividi tramite