共用方式為


具名實體辨識認知技能 (v2)

名實體辨識 技能 (v2) 會從文字中擷取具名實體。 可用的實體包括 類型 personlocationorganization

重要

具名實體辨識技能 (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) 現在已由 Microsoft.Skills.Text.V3.EntityRecognitionSkill 取代。 請遵循淘汰的 Azure AI 搜尋技能中的建議,遷移至支援的技能。

注意

當您藉由增加處理頻率、新增更多檔或新增更多 AI 演算法來擴充範圍時,您必須 附加可計費的 Azure AI 服務資源。 在 Azure AI 服務中呼叫 API,並在 Azure AI 搜尋中作為檔破解階段的影像擷取時產生費用。 從文件擷取文字不會產生任何費用。 內建技能的執行會依現有的 Azure AI 服務預付型方案價格收費。

影像擷取是由 Azure AI 搜尋所計費的額外費用,如定價頁面上所述。 文字擷取是免費的。

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

資料限制

記錄的大小上限應該是 50,000 個字元 (以 String.Length 為測量單位)。 如果您需要在將數據傳送至關鍵片語擷取器之前中斷數據,請考慮使用 文字分割技能。 如果您使用文字分割技能,請將頁面長度設定為 5000 以獲得最佳效能。

技能參數

這些參數會區分大小寫。

參數名稱 描述
categories 應擷取的類別數位。 可能的類別類型:"Person"、、"Location""Organization"。 如果未提供任何類別,則會傳回所有類型。
defaultLanguageCode 輸入文字的語言代碼。 支援下列語言: de, en, es, fr, it
minimumPrecision 介於 0 到 1 之間的數位。 如果有效位數低於此值,則不會傳回實體。 預設值是 0。

技能輸入

輸入名稱 描述
languageCode 選擇性。 預設值為 "en"
text 要分析的文字。

技能輸出

輸出名稱 描述
字串陣列,其中每個字串都代表人員的名稱。
位置 字串陣列,其中每個字串都代表位置。
組織 字串陣列,其中每個字串都代表組織。
實體 複雜類型的陣列。 每個複雜類型都包含下列欄位:
  • category ("person""organization""location"
  • value (實際實體名稱)
  • offset (文字中找到的位置)
  • confidence (介於 0 到 1 之間的值,表示該值為實際實體的信賴度)

範例定義

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

範例輸入

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

範例輸出

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

警告案例

如果不支援文件的語言代碼,則會傳回警告,而且不會擷取任何實體。

另請參閱