具名實體辨識認知技能 (v2)
具 名實體辨識 技能 (v2) 會從文字中擷取具名實體。 可用的實體包括 類型 person
、 location
與 organization
。
重要
具名實體辨識技能 (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) 現在已由 Microsoft.Skills.Text.V3.EntityRecognitionSkill 取代。 請遵循淘汰的 Azure AI 搜尋技能中的建議,遷移至支援的技能。
注意
當您藉由增加處理頻率、新增更多檔或新增更多 AI 演算法來擴充範圍時,您必須 附加可計費的 Azure AI 服務資源。 在 Azure AI 服務中呼叫 API,並在 Azure AI 搜尋中作為檔破解階段的影像擷取時產生費用。 從文件擷取文字不會產生任何費用。 內建技能的執行會依現有的 Azure AI 服務預付型方案價格收費。
影像擷取是由 Azure AI 搜尋所計費的額外費用,如定價頁面上所述。 文字擷取是免費的。
@odata.type
Microsoft.Skills.Text.NamedEntityRecognitionSkill
資料限制
記錄的大小上限應該是 50,000 個字元 (以 String.Length
為測量單位)。 如果您需要在將數據傳送至關鍵片語擷取器之前中斷數據,請考慮使用 文字分割技能。 如果您使用文字分割技能,請將頁面長度設定為 5000 以獲得最佳效能。
技能參數
這些參數會區分大小寫。
參數名稱 | 描述 |
---|---|
categories | 應擷取的類別數位。 可能的類別類型:"Person" 、、"Location" "Organization" 。 如果未提供任何類別,則會傳回所有類型。 |
defaultLanguageCode | 輸入文字的語言代碼。 支援下列語言: de, en, es, fr, it |
minimumPrecision | 介於 0 到 1 之間的數位。 如果有效位數低於此值,則不會傳回實體。 預設值是 0。 |
技能輸入
輸入名稱 | 描述 |
---|---|
languageCode | 選擇性。 預設值為 "en" 。 |
text | 要分析的文字。 |
技能輸出
輸出名稱 | 描述 |
---|---|
人 | 字串陣列,其中每個字串都代表人員的名稱。 |
位置 | 字串陣列,其中每個字串都代表位置。 |
組織 | 字串陣列,其中每個字串都代表組織。 |
實體 | 複雜類型的陣列。 每個複雜類型都包含下列欄位:
|
範例定義
{
"@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
"categories": [ "Person", "Location", "Organization"],
"defaultLanguageCode": "en",
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "persons",
"targetName": "people"
}
]
}
範例輸入
{
"values": [
{
"recordId": "1",
"data":
{
"text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
"languageCode": "en"
}
}
]
}
範例輸出
{
"values": [
{
"recordId": "1",
"data" :
{
"persons": [ "Joe Romero", "Ana Smith"],
"locations": ["Chile", "Australia"],
"organizations":["Microsoft"],
"entities":
[
{
"category":"person",
"value": "Joe Romero",
"offset": 33,
"confidence": 0.87
},
{
"category":"person",
"value": "Ana Smith",
"offset": 124,
"confidence": 0.87
},
{
"category":"location",
"value": "Chile",
"offset": 88,
"confidence": 0.99
},
{
"category":"location",
"value": "Australia",
"offset": 112,
"confidence": 0.99
},
{
"category":"organization",
"value": "Microsoft",
"offset": 54,
"confidence": 0.99
}
]
}
}
]
}
警告案例
如果不支援文件的語言代碼,則會傳回警告,而且不會擷取任何實體。
另請參閱
- 內建技能
- 如何定義技能集 (英文)
- 實體辨識技能 (V3)