Kognitivní dovednost rozpoznávání pojmenovaných entit (v2)
Dovednost rozpoznávání pojmenovaných entit (v2) extrahuje pojmenované entity z textu. Mezi dostupné entity patří typy person
location
a organization
.
Důležité
Dovednost rozpoznávání pojmenovaných entit (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) je nyní ukončena nahrazením Microsoft.Skills.Text.V3.EntityRecognitionSkill. Pokud chcete migrovat na podporovanou dovednost, postupujte podle doporučení v zastaralých dovednostech služby Azure AI Search.
Poznámka:
Když rozšiřujete rozsah zvýšením frekvence zpracování, přidáním dalších dokumentů nebo přidáním dalších algoritmů AI, budete muset připojit fakturovatelný prostředek služeb Azure AI. Poplatky se účtují při volání rozhraní API ve službách Azure AI a extrakce obrázků v rámci fáze prolomení dokumentů ve službě Azure AI Search. Za extrakci textu z dokumentů se neúčtují žádné poplatky. Provádění integrovaných dovedností se účtuje za stávající cenu průběžných plateb za služby Azure AI.
Extrahování obrázků je dodatečné poplatky účtované službou Azure AI Search, jak je popsáno na stránce s cenami. Extrakce textu je volná.
@odata.type
Microsoft.Skills.Text.NamedEntityRecognitionSkill
Omezení dat
Maximální velikost záznamu by měla být 50 000 znaků měřená String.Length
hodnotou . Pokud potřebujete data před odesláním do extraktoru klíčových frází rozdělit, zvažte použití dovednosti Rozdělení textu. Pokud používáte dovednost rozdělení textu, nastavte délku stránky na 5 000 pro nejlepší výkon.
Parametry dovedností
Parametry rozlišují malá a velká písmena.
Název parametru | Popis |
---|---|
categories | Pole kategorií, které by se měly extrahovat. Možné typy kategorií: "Person" , "Location" . "Organization" Pokud není k dispozici žádná kategorie, vrátí se všechny typy. |
defaultLanguageCode | Kód jazyka vstupního textu Podporují se následující jazyky: de, en, es, fr, it |
minimumPrecision | Číslo mezi 0 a 1. Pokud je přesnost nižší než tato hodnota, entita se nevrátí. Výchozí hodnota je 0. |
Vstupy dovedností
Název vstupu | Popis |
---|---|
languageCode | Nepovinné. Výchozí hodnota je "en" . |
text | Text, který chcete analyzovat. |
Výstupy dovedností
Název výstupu | Popis |
---|---|
osoby | Pole řetězců, kde každý řetězec představuje jméno osoby. |
umístění | Pole řetězců, kde každý řetězec představuje umístění. |
organizations | Pole řetězců, ve kterých každý řetězec představuje organizaci. |
entities | Pole komplexních typů. Každý komplexní typ obsahuje následující pole:
|
Ukázková definice
{
"@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
"categories": [ "Person", "Location", "Organization"],
"defaultLanguageCode": "en",
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "persons",
"targetName": "people"
}
]
}
Ukázkový vstup
{
"values": [
{
"recordId": "1",
"data":
{
"text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
"languageCode": "en"
}
}
]
}
Ukázkový výstup
{
"values": [
{
"recordId": "1",
"data" :
{
"persons": [ "Joe Romero", "Ana Smith"],
"locations": ["Chile", "Australia"],
"organizations":["Microsoft"],
"entities":
[
{
"category":"person",
"value": "Joe Romero",
"offset": 33,
"confidence": 0.87
},
{
"category":"person",
"value": "Ana Smith",
"offset": 124,
"confidence": 0.87
},
{
"category":"location",
"value": "Chile",
"offset": 88,
"confidence": 0.99
},
{
"category":"location",
"value": "Australia",
"offset": 112,
"confidence": 0.99
},
{
"category":"organization",
"value": "Microsoft",
"offset": 54,
"confidence": 0.99
}
]
}
}
]
}
Případy upozornění
Pokud kód jazyka dokumentu není podporován, vrátí se upozornění a nebudou extrahovány žádné entity.