次の方法で共有


オブジェクトの検出

この記事では、物体検出の概念について説明します。 オブジェクトの検出はタグ付けに似ていますが、API で返されるのは、イメージに検出された各オブジェクトの境界ボックスの座標 (ピクセル単位) です。 たとえば犬、猫、人物が画像に含まれている場合、物体検出操作によって、それらのオブジェクトと共にそれに対応する座標がその画像に一覧表示されます。 この機能を使用すれば、画像に含まれるオブジェクト間の関係を処理することができます。 画像内に同じオブジェクトのインスタンスが複数存在するかどうかも判別できます。

オブジェクト検出機能は、画像内で特定されたオブジェクトや生物に応じてタグを適用します。 タグ付けの分類と物体検出の分類との間に、正式な関係は存在しません。 概念レベルでは、物体検出機能は物体や生物のみを検出しますが、タグ機能には、境界ボックスでは位置特定できない 屋内 などの文脈上の用語も含めることができます。

Azure AI Vision Studio を使用して、ブラウザーですばやく簡単にオブジェクト検出の機能を試すことができます。

オブジェクト検出の例

次の JSON 応答は、Analyze Image API がサンプル画像からオブジェクトを検出するときに返す内容を示しています。

キッチンで Microsoft Surface デバイスを使用する女性の写真。

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

制限事項

検知漏れ (見落とされたオブジェクト) や詳細の利用制限の影響を回避または軽減できるように、オブジェクト検出の制限事項に注意することが重要です。

  • オブジェクトが小さい (画像の 5% 未満) 場合、通常、それらのオブジェクトは検出されません。
  • オブジェクトが近くに配置されている場合 (積み重ねられた皿など)、通常、それらのオブジェクトは検出されません。
  • オブジェクトは、ブランド名や製品名 (店の棚にある各種のソーダなど) によって区別されません。 ただし、ブランド検出機能を使用すると画像からブランド情報を取得できます。

API の使用

オブジェクト検出機能は Analyze Image API に含まれています。 ネイティブ SDK または REST を呼び出すことでこの API を呼び出すことができます。 visualFeatures クエリ パラメーターに Objects を含めます。 次に、完全な JSON 応答が得られたら、objects セクションのコンテンツの文字列を解析します。