物件偵測

發行項
10/31/2024

本文說明對象偵測的概念。物件偵測與標記功能類似，但 API 會傳回影像中每個所找到物件的週框方塊座標 (以像素為單位)。例如，如果影像包含狗、貓或人物，物件偵測作業就會列出這些物件及其在影像中的座標。您可以使用此功能來處理影像中物件之間的關聯性。此功能也可讓您判斷影像中是否有多個相同物件的執行個體。

偵測物件偵測函式會根據在影像中識別到的物件或生物來套用標記。標記分類法與物件偵測分類法之間沒有正式的關聯性。在概念層級，對象偵測函式只會尋找物件和生活專案，而標籤式也可以包含內容相關詞彙，例如室內，而不能使用周框方塊進行當地語系化。

使用 Azure AI Vision Studio 快速且輕鬆地在瀏覽器中試用物件偵測的功能。

試用 Vision Studio

物件偵測範例

下列 JSON 回應顯示分析影像 API 在偵測到範例影像中的物件時所傳回的內容。

照片顯示一名女子在廚房中使用Microsoft Surface 裝置。

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

限制

請務必注意物件偵測的限制，以避免或降低誤判 (遺失物件) 和限制細節的影響。

太小的物件通常不會偵測到 (低於影像的 5%)。
排列緊密的物件通常不會偵測到 (例如一疊盤子)。
無法依品牌或產品名稱區分物件 (例如貨架上有不同種類的汽水)。不過，您可以使用品牌偵測功能，從影像中取得品牌資訊。

使用 API

物件偵測功能是分析影像 API 的一部分。您可以透過原生 SDK 或 REST 呼叫來呼叫此 API。包含在 Objects 查詢參數中 visualFeatures 。然後，當您取得完整的 JSON 回應時，剖析物件區段內容的字串。

快速入門：影像分析

共用方式為

物件偵測

物件偵測範例

限制

使用 API

意見反應

其他資源