Competenza cognitiva di Entity Linking (v3)
La competenza Entity Linking (v3) restituisce un elenco di entità riconosciute con collegamenti ad articoli in una knowledge base nota (Wikipedia).
Nota
Questa competenza è associata ai modelli di Machine Learning Entity Linking nel linguaggio di intelligenza artificiale di Azure e richiede una risorsa fatturabile per le transazioni che superano 20 documenti per indicizzatore al giorno. L'esecuzione delle competenze predefinite viene addebitata secondo gli attuali prezzi con pagamento in base al consumo dei Servizi di Azure AI.
@odata.type
Microsoft.Skills.Text.V3.EntityLinkingSkill
Limiti dei dati
Le dimensioni massime di un record devono essere di 50.000 caratteri in base alla misurazione di String.Length
. Se è necessario suddividere i dati prima di inviarli alla competenza EntityLinking, è consigliabile usare la competenza Suddivisione testo. Se si usa una competenza di suddivisione del testo, impostare la lunghezza della pagina su 5000 per ottenere prestazioni ottimali.
Parametri della competenza
I nomi dei parametri fanno distinzione tra maiuscole e minuscole e sono tutti facoltativi.
Nome parametro | Descrizione |
---|---|
defaultLanguageCode |
Codice lingua del testo di input. Se il codice lingua predefinito non è specificato, Inglese (en) verrà usato come il codice lingua predefinito. Vedi l'elenco completo di linguaggi supportati. |
minimumPrecision |
Immettere un valore compreso tra 0 e 1. Se il punteggio di attendibilità (nell'output) è inferiore a questo valore, l'entità entities non viene restituita. Il valore predefinito è 0. |
modelVersion |
(Facoltativo) Specifica la versione del modello da usare quando si chiama il collegamento di entità. L'impostazione predefinita sarà la versione più recente disponibile se non specificata. È consigliabile non specificare questo valore a meno che non sia necessario. |
Input competenze
Nome input | Descrizione |
---|---|
languageCode |
Stringa che indica la lingua dei record. Se questo parametro viene omesso, il codice lingua predefinito verrà usato per analizzare i record. Vedi l'elenco completo di linguaggi supportati. |
text |
Testo da analizzare. |
Output competenze
Nome output | Descrizione |
---|---|
entities |
Matrice di tipi complessi che contiene i campi seguenti:
|
Definizione di esempio
{
"@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
"context": "/document",
"defaultLanguageCode": "en",
"minimumPrecision": 0.5,
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/language"
}
],
"outputs": [
{
"name": "entities",
"targetName": "entities"
}
]
}
Input di esempio
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Microsoft is liked by many.",
"languageCode": "en"
}
}
]
}
Output di esempio
{
"values": [
{
"recordId": "1",
"data" :
{
"entities": [
{
"name": "Microsoft",
"id": "Microsoft",
"language": "en",
"url": "https://en.wikipedia.org/wiki/Microsoft",
"bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85",
"dataSource": "Wikipedia",
"matches": [
{
"text": "Microsoft",
"offset": 0,
"length": 9,
"confidenceScore": 0.13
}
]
}
],
}
}
]
}
Gli offset restituiti per le entità nell'output di questa competenza vengono restituiti direttamente dalle API del servizio di linguaggio, ovvero se vengono usate per indicizzare nella stringa originale, è consigliabile usare la classe StringInfo in .NET per estrarre il contenuto corretto. Per altre informazioni, vedere Supporto multilingue ed emoji nelle funzionalità del servizio di linguaggio.
Casi di avviso
Se il codice linguistico per il documento non è supportato, viene restituito un avviso e non vengono estratte entità.