實體連結認知技能 (v3)
實體連結技能 (v3) 會傳回已辨識的實體清單,其中包含已知 知識庫 (Wikipedia) 中文章的連結。
注意
此技能會系結至 Azure AI 語言中的實體鏈接機器學習模型,而且需要每天超過 20 份檔的交易計費資源。 內建技能的執行會依現有的 Azure AI 服務預付型方案價格收費。
@odata.type
Microsoft.Skills.Text.V3.EntityLinkingSkill
資料限制
記錄的大小上限應該是 50,000 個字元 (以 String.Length
為測量單位)。 如果您需要在將數據傳送至 EntityLinking 技能之前中斷數據,請考慮使用 文字分割技能。 如果您使用文字分割技能,請將頁面長度設定為 5000 以獲得最佳效能。
技能參數
參數名稱會區分大小寫,而且都是選擇性的。
參數名稱 | 描述 |
---|---|
defaultLanguageCode |
輸入文字的語言代碼。 如果未指定預設語言代碼,則會使用英文 (en) 作為預設語言代碼。 查看支援語言的完整清單。 |
minimumPrecision |
介於 0 和 1 之間的值。 如果信賴分數 (在輸出中 entities ) 低於此值,則不會傳回實體。 預設值是 0。 |
modelVersion |
(選擇性)指定 呼叫實體連結時要使用的模型 版本。 如果未指定,則會預設為最新的可用。 除非有必要,否則建議您不要指定此值。 |
技能輸入
輸入名稱 | 描述 |
---|---|
languageCode |
字串,表示記錄的語言。 如果未指定此參數,則會使用預設語言程式代碼來分析記錄。 查看支援語言的完整清單。 |
text |
要分析的文字。 |
技能輸出
輸出名稱 | 描述 |
---|---|
entities |
包含下列欄位的複雜型別數組:
|
範例定義
{
"@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
"context": "/document",
"defaultLanguageCode": "en",
"minimumPrecision": 0.5,
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/language"
}
],
"outputs": [
{
"name": "entities",
"targetName": "entities"
}
]
}
範例輸入
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Microsoft is liked by many.",
"languageCode": "en"
}
}
]
}
範例輸出
{
"values": [
{
"recordId": "1",
"data" :
{
"entities": [
{
"name": "Microsoft",
"id": "Microsoft",
"language": "en",
"url": "https://en.wikipedia.org/wiki/Microsoft",
"bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85",
"dataSource": "Wikipedia",
"matches": [
{
"text": "Microsoft",
"offset": 0,
"length": 9,
"confidenceScore": 0.13
}
]
}
],
}
}
]
}
此技能輸出中實體傳回的位移會直接從 語言服務 API 傳回,這表示如果您使用它們來編製原始字串的索引,則應該使用 .NET 中的 StringInfo 類別來擷取正確的內容。 如需詳細資訊,請參閱 語言服務功能中的多語系和表情符號支援。
警告案例
如果不支援文件的語言代碼,則會傳回警告,而且不會擷取任何實體。