次の方法で共有


顔検出の分析情報を取得する

顔検出

顔検出はメディア ファイル内の顔を検出し、類似した顔のインスタンスをグループに集計します。

顔検出の分析情報は、各顔のサムネイルと名前または ID を含む JSON ファイル内のカテゴリ別の一覧として生成されます。 Web ポータルで、顔のサムネイルを選択すると、人物の名前 (認識された場合)、その人物が表示されたビデオの割合、人物の伝記 (著名人の場合) などの情報が表示されます。 また、その人物が登場するビデオ内のインスタンス間をスクロールすることもできます。

著名人認識モデル

著名人認識モデルは、約 100 万人の顔を対象とし、よく要求されるデータ ソースに基づいています。 Video Indexer が著名人として認識しない顔は検出されますが、名前は付けられません。 独自のカスタム人物モデルを構築し、既定では認識されない顔が認識されるように Video Indexer をトレーニングできます。

重要

Microsoft の責任ある AI の原則をサポートするために、顔識別、カスタマイズ、および著名人認識機能へのアクセスは制限されており、適格性と使用基準に基づいています。 顔識別、カスタマイズ、および著名人認識機能は、Microsoft が管理するお客様とパートナーが利用できます。 利用申請を行うには、顔認識受付フォームを使用してください。

顔検出のユース ケース

次のリストは、顔検出の一般的なユース ケースの例を示しています。

  • 組織のアーカイブ内で特定の顔をディープ検索して、特定の有名人に関する分析情報を得ることで、映画で俳優が登場する場所を要約したり、映像を再利用したりします。
  • 通信社やスポーツ エージェンシーで特集記事を作成する際の効率を向上させます。 たとえば、組織のアーカイブで有名人やサッカー選手をのディープ検索を行う場合などです。
  • ビデオに登場する顔を使用して、キャンペーン、予告編、ハイライトを作成します。 Video Indexer は、キーフレーム、シーン マーカー、タイム スタンプ、ラベ付けを追加することで、コンテンツ編集者が多数のファイルの確認に費やす時間を短縮できるよう支援できます。

重要な用語

項目 定義
顔認識 画像を分析して、画像に表示される顔を識別します。 このプロセスは、Azure AI Face API を使用して実装されます。
登録 テンプレート作成のために個人の画像を登録し、認識できるようにするプロセス。 ある人物が認証に使用される検証システムに登録されると、その人物のテンプレートは、プローブ テンプレートと比較するテンプレートを決定するために使用されるプライマリ識別子にも関連付けられます。 高品質の画像や、人の見た目の自然な変化 (眼鏡をかけている場合とかけていない場合など) を表す画像は、高品質の登録テンプレートを生成します。
テンプレート 人物の登録された画像はテンプレートに変換されてから、顔認識に使用されます。 個人のテンプレートを作成するために、マシンで解釈可能な特徴がその個人の 1 つ以上の画像から抽出されます。 登録やプローブの画像は Face API によって格納されず、元の画像をテンプレートに基づいて再構築することはできません。 テンプレートの品質は、結果の精度を決定する重要な要因です。

Web ポータルで分析情報 JSON を表示する

ビデオをアップロードしてインデックスを作成すると、Web ポータルを使用してダウンロードするための JSON 形式で分析情報を入手できます。

  1. Library タブを選択します。
  2. 操作するメディアを選択します。
  3. ダウンロードを選択し、Insights (JSON)を選択します。 JSON ファイルが新しいブラウザー タブで開きます。
  4. 応答例で説明されているキー ペアを探します。

API の使用

  1. Get Video Index 要求を使用します。 &includeSummarizedInsights=false渡すことをお勧めします。
  2. 応答例で説明されているキー ペアを探します。

重要

UI で顔検出を確認すると、ビデオに登場するすべての顔が表示されていない場合があります。 信頼度が 0.5 を超える顔グループのみ公開されます。顔は、少なくとも 4 秒または video_duration の値の10% の間表示されている必要があります。 これらの条件が満たされた場合のみ、UI と Insights.json ファイルに顔が表示されます。 次の API を使用して、顔成果物ファイルからすべての顔インスタンスをいつでも取得できます: https://api.videoindexer.ai/{location}/Accounts/{accountId}/Videos/{videoId}/ArtifactUrl[?Faces][&accessToken]

応答の例

    "faces": [
        {
        "id": 1785,
        "name": "Emily Tran",
        "confidence": 0.7855,
        "description": null,
        "thumbnailId": "fd2720f7-b029-4e01-af44-3baf4720c531",
        "knownPersonId": "92b25b4c-944f-4063-8ad4-f73492e42e6f",
        "title": null,
        "imageUrl": null,
        "thumbnails": [
            {
            "id": "4d182b8c-2adf-48a2-a352-785e9fcd1fcf",
            "fileName": "FaceInstanceThumbnail_4d182b8c-2adf-48a2-a352-785e9fcd1fcf.jpg",
            "instances": [
                {
                "adjustedStart": "0:00:00",
                "adjustedEnd": "0:00:00.033",
                "start": "0:00:00",
                "end": "0:00:00.033"
                }
            ]
            },
            {
            "id": "feff177b-dabf-4f03-acaf-3e5052c8be57",
            "fileName": "FaceInstanceThumbnail_feff177b-dabf-4f03-acaf-3e5052c8be57.jpg",
            "instances": [
                {
                "adjustedStart": "0:00:05",
                "adjustedEnd": "0:00:05.033",
                "start": "0:00:05",
                "end": "0:00:05.033"
                }
            ]
            },
        ]
        }
    ]

重要

すべてのVI機能の トランスパレンシーノートの概要 を読む必要があります。 各分析情報には、独自の透明性に関するメモもあります。

顔検出に関する注意事項

顔検出は、責任を持って慎重に使用される多くの業界向けのツールです。 他の人のプライバシーと安全性を尊重し、現地およびグローバルの規制を遵守するために、使用に関する以下のガイドラインに従うことをお勧めします。

  • 結果の精度を慎重に検討してください。 検出の正確性をより高めるために、ビデオの品質を確認してください。 低品質のビデオは、提供される分析情報に影響を与える可能性があります。
  • 顔検出を法執行機関に使用する場合は、結果を慎重に確認してください。 人物が小さかったり、座っていたり、しゃがんでいたり、物や他の人に邪魔されていたりする場合、検出されない可能性があります。 公正で質の高い決定を保証するために、顔検出に基づく自動化と人による監視を組み合わせてください。
  • 深刻な悪影響を及ぼす可能性のある決定には、顔検出を使用しないでください。 誤った出力に基づく決定は、深刻な悪影響をもたらす可能性があります。 個人に深刻な影響を与える可能性のある決定については、人によるレビューを含めることをお勧めします。

顔検出のコンポーネント

次の表は、メディア ファイル内の画像が顔検出手順でどのように処理されるかを示しています。

コンポーネント 定義
ソース ファイル ユーザーは、インデックス作成のためにソース ファイルをアップロードします。
検出と集計 顔検出器が各フレーム内の顔を識別します。 その後、顔が集計され、グループ化されます。
認識 著名人モデルにより、集約されたグループが処理されて、有名人が認識されます。 独自の人物モデルを作成した場合は、他の人物も認識するようにグループが処理されます。 人物が認識されない場合は、Unknown1、Unknown2 などのラベルが付けられます。
信頼度値 よく知られた顔、またはカスタマイズ可能なリストで識別される顔に適用可能な場合、各ラベルの推定される信頼度レベルは 0 から 1 の範囲で計算されます。 信頼度スコアは、結果の精度の確実性を表しています。 たとえば、82 パーセントの確実性はスコア 0.82 として表されます。

サンプル コード

VIのすべてのサンプルを見る