Come usare Riconoscimento entità denominata
La funzionalità Riconoscimento entità denominata può valutare il testo non strutturato ed estrarre entità denominate dal testo in diverse categorie predefinite, ad esempio persona, posizione, evento, prodotto e organizzazione.
Opzioni di sviluppo
Per usare Riconoscimento entità denominata, inviare testo non strutturato e non elaborato per l’analisi e gestire l’output dell'API nell'applicazione. L'analisi viene eseguita così come è, senza alcuna personalizzazione aggiuntiva del modello usato sui dati. Riconoscimento entità denominata può essere usato in due modi:
Opzione di sviluppo | Descrizione |
---|---|
Language Studio | Language Studio è una piattaforma basata sul Web che consente di provare a collegare entità con esempi di testo senza un account Azure e usando i propri dati quando si effettua l'iscrizione. Per altre informazioni, vedere il sito Web di Language Studio o la guida introduttiva di Language Studio. |
API REST o libreria client (SDK di Azure) | Integrare Riconoscimento entità denominata nelle applicazioni usando l'API REST o la libreria client disponibile in un'ampia gamma di lingue. Per altre informazioni, vedere l'argomento Riconoscimento entità denominata nella guida introduttiva. |
Determinare come elaborare i dati (facoltativo)
Lingue di input
Quando si inviano documenti da elaborare, è possibile specificare le lingue supportate in cui sono scritti. Se non si specifica una lingua, per impostazione predefinita l'estrazione delle frasi chiave verrà impostata sull'inglese. L'API può restituire offset nella risposta per supportare diverse codifiche multilingue ed emoji.
Invio di dati
Al momento della ricezione della richiesta viene eseguita l'analisi. L'uso della funzionalità Riconoscimento entità denominata in modo sincrono è senza stato. Non vengono archiviati dati nell'account e i risultati vengono restituiti immediatamente nella risposta.
Quando si usa questa funzionalità in modo asincrono, i risultati dell'API sono disponibili per 24 ore dal momento in cui la richiesta è stata inserita e ciò viene indicato nella risposta. Dopo questo periodo di tempo, i risultati vengono rimossi e non sono più disponibili per il recupero.
L'API tenta di rilevare le categorie di entità definite per una determinata lingua del documento.
Ottenere i risultati di Riconoscimento entità denominata
Quando si ottengono risultati dal Riconoscimento entità denominata, è possibile trasmettere i risultati a un'applicazione o salvare l'output in un file nel sistema locale. La risposta API include entità riconosciute, incluse le relative categorie e sottocategorie e punteggi di attendibilità.
Selezionare le entità da restituire
L'API tenta di rilevare i tipi e i tag di entità definiti per una determinata lingua del documento. I tipi di entità e i tag sostituiscono le categorie e le sottocategorie strutturano i modelli meno recenti usati per definire le entità per una maggiore flessibilità. È inoltre possibile specificare quali entità vengono rilevate e restituite, utilizzando i parametri opzionali includeList
e excludeList
con i tipi di entità appropriati. Nell'esempio seguente viene rilevato solo Location
. È possibile specificare uno o più tipi di entità da restituire. Data la gerarchia dei tipi e dei tag introdotta per questa versione, è possibile filtrare in base a diversi livelli di granularità, come indicato di seguito:
Input:
Nota
In questo esempio restituisce solo il tipo di entità "Location".
{
"kind": "EntityRecognition",
"parameters":
{
"includeList" :
[
"Location"
]
},
"analysisInput":
{
"documents":
[
{
"id":"1",
"language": "en",
"text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
}
]
}
}
Gli esempi precedenti restituiscono entità che rientrano nel tipo di entità Location
, ad esempio GPE
, Structural
e Geological
entità contrassegnate come descritte dai tipi di entità e dai tag. È anche possibile filtrare ulteriormente le entità restituite filtrando tramite l’utilizzo di uno dei tag di entità per il tipo di entità Location
, ad esempio filtrando solo sul tag GPE
come descritto:
"parameters":
{
"includeList" :
[
"GPE"
]
}
Questo metodo restituisce tutte le entità Location
che rientrano solo nel tag GPE
e ignora qualsiasi altra entità che rientra nel tipo Location
contrassegnato con qualsiasi altro tag di entità, ad esempio entità Location
contrassegnate Structural
o Geological
. È anche possibile eseguire il drill-down dei risultati usando il parametro excludeList
. GPE
entità con tag possono essere contrassegnate con i tag seguenti: City
, State
, CountryRegion
, Continent
. Ad esempio, è possibile escludere tag Continent
e CountryRegion
per questo esempio:
"parameters":
{
"includeList" :
[
"GPE"
],
"excludeList": :
[
"Continent",
"CountryRegion"
]
}
L'uso di questi parametri consente di filtrare correttamente solo i tipi di entità Location
, poiché il tag di entità GPE
incluso nel parametro includeList
rientra nel tipo Location
. Vengono quindi filtrate solo le entità geopolitiche ed escluse eventuali entità contrassegnate con tag Continent
o CountryRegion
.
Attributi di output aggiuntivi
Per fornire agli utenti maggiori informazioni sui tipi di un'entità e offrire maggiore usabilità, NER supporta questi attributi nell'output:
Nome dell'attributo | Type | Definizione |
---|---|---|
type |
String | Tipo più specifico di entità rilevata. Ad esempio, "Seattle" è un City oggetto , un'entità GPE geografica politica e un oggetto Location . La classificazione più granulare per "Seattle" è che si tratta di un oggetto City . Il tipo sarà City per il testo "Seattle". |
tags |
Elenco (tag) | Elenco di oggetti tag che esprime l'affinità dell'entità rilevata a una gerarchia o a qualsiasi altro raggruppamento. Un tag contiene due campi: 1. name : nome univoco per il tag.2. confidenceScore : punteggio di attendibilità associato per un tag compreso tra 0 e 1.Questo tagName univoco viene usato per filtrare nei inclusionList parametri e exclusionList . |
metadata |
Object | I metadati sono un oggetto contenente più dati sul tipo di entità rilevato. Cambia in base al campo metadataKind . |
Output di esempio
Questo output di esempio include un esempio degli attributi di output aggiuntivi.
{
"kind": "EntityRecognitionResults",
"results": {
"documents": [
{
"id": "1",
"entities": [
{
"text": "Microsoft",
"category": "Organization",
"type": "Organization",
"offset": 0,
"length": 9,
"confidenceScore": 0.97,
"tags": [
{
"name": "Organization",
"confidenceScore": 0.97
}
]
},
{
"text": "One",
"category": "Quantity",
"type": "Number",
"subcategory": "Number",
"offset": 21,
"length": 3,
"confidenceScore": 0.9,
"tags": [
{
"name": "Number",
"confidenceScore": 0.8
},
{
"name": "Quantity",
"confidenceScore": 0.8
},
{
"name": "Numeric",
"confidenceScore": 0.8
}
],
"metadata": {
"metadataKind": "NumberMetadata",
"numberKind": "Integer",
"value": 1.0
}
}
],
"warnings": []
}
],
"errors": [],
"modelVersion": "2023-09-01"
}
}
Specificare il modello Riconoscimento entità denominata
Per impostazione predefinita, questa funzionalità userà il modello di intelligenza artificiale più recente disponibile nel testo. È anche possibile configurare le richieste API per l'uso di una versione del modello specifica.
Limiti relativi al servizio e ai dati
Vedere l'articolo sui limiti del servizio per informazioni sulle dimensioni e il numero di richieste che è possibile inviare al minuto e al secondo.