次の方法で共有


ビデオ分析とは

ビデオ分析には、空間分析やビデオ検索のようなビデオ関連の機能が含まれています。

空間分析

重要

2025 年 3 月 30 日に、Azure AI Vision Spatial Analysis は廃止されます。 指定された日付までに、Azure AI Video Indexer または別のオープンソース ソリューションに移行してください。 Azure AI Video Indexer の豊富なメリットを活用できるように、早めに切り替えることをお勧めします。 ご利用の使い慣れた機能に加えて、Azure AI Vision Spatial Analysis と Azure AI Video Indexer の簡単な比較を次に示します。

機能 Azure AI Vision 空間分析 Azure AI Video Indexer
Edge のサポート はい はい
オブジェクトの検出 人物と車両の検出のみ 1000 以上のオブジェクトを検出
オーディオ/音声処理 サポートされていません サポートされている (音声の文字起こし、翻訳、要約を含む)
サポートされている > (音声の文字起こしおよび感情分析を含む)
イベントの検出と追跡 サポートされている (人物と車両の追跡、イベント検出) Edge ではまだサポートされていません。 クラウドで部分的にサポートされています。
Azure Arc のサポート サポートされていません ネイティブ サポート
フォーカス領域 特殊な追跡を使用したビジュアル分析 オーディオとビジュアルの両方のコンテンツの包括的な分析

現在から 2025 年 3 月 30 日までは、引き続き Azure AI Vision Spatial Analysis を使用することも、指定された日付より前に Azure AI Video Indexer に移行することもできます。 2025 年 3 月 30 日以降、Spatial Analysis コンテナーはサポートされなくなり、新しいストリームの処理が停止されます。

Azure AI Vision の空間分析を使用して、動画内の人の存在と動きを検出できます。 カメラから動画ストリームを取り込み、分析情報を抽出し、他のシステムで使用するイベントを生成します。 このサービスでは、空間に入ってくる人の数を数えたり、マスクやソーシャル ディスタンスのガイドラインに対するコンプライアンスを測定したりすることができます。 物理空間からの動画ストリームを処理することで、人々がどのようにそれらを利用しているかを学び、組織にとっての空間の価値を最大限に高めることができます。

Azure AI Vision Studio を使用して、ブラウザーで空間分析の機能をすばやく簡単に試すことができます。

人数カウント

この操作では、PersonCount 操作を使用して、特定のゾーン内の経時的な人数がカウントされます。 ここでは、フレーム間で人を追跡せずに、処理されるフレームごとに独立したカウントが生成されます。 この操作を使用して、空間内の人の数を推定したり、人が現れたときにアラートを生成したりすることができます。

空間分析でカメラの視野内の人の数がカウントされる方法を示すアニメーション。

入り口でのカウント

この機能では、人がエリア内にいた時間、または入り口を通過した時刻が監視されます。 この監視は、PersonCrossingPolygon 操作または PersonCrossingLine 操作を使用して実行できます。 小売のシナリオでは、これらの操作を使用して、レジの行列の待ち時間や展示に対するエンゲージメントを測定できます。 これらの操作では、他の商用ビルのシナリオで、ロビーや特定の階での歩行者を測定できます。

境界線で囲まれた空間に出入りする人々のフレームを示し、その周囲に四角形が描かれたアニメーション。

ソーシャル ディスタンスとマスクの検出

この機能では、人々が空間内のソーシャル ディスタンス要件にどれだけ従っているかを分析します。 このシステムは PersonDistance 操作を使用して、人々が空間内を歩き回るときに自動的に調整を行います。 そして、人が特定の距離のしきい値 (6 フィートまたは 10 フィート) に違反したことを識別します。

空間分析により人々の間の距離を示す線が表示され、ソーシャル ディスタンス違反イベントを視覚化する方法を示すアニメーション。

空間分析では、人がマスクなどの顔を保護するものを装着しているかどうかを検出するようにも構成できます。 ENABLE_FACE_MASK_CLASSIFIER パラメーターを構成することで、PersonCount、PersonCrossingLine、PersonCrossingPolygon の操作に対してマスク分類子を有効にすることができます。

エレベーター内で人々がマスクを着用しているかどうかを空間分析が分類する方法を示す写真。

ビデオ検索

ビデオ検索は、検索インデックスを作成し、そこにドキュメント (ビデオと画像) を追加して、自然言語で検索できるサービスです。 開発者は、各インデックスのメタデータ スキーマを定義し、検索に役立つメタデータをサービスに取り込むことができます。 また、開発者はインデックスから抽出する特徴量 (ビジョン、音声) を指定し、特徴量に基づいて検索をフィルター処理することもできます。

入力の要件

空間分析は、次の要件を満たす動画で動作します。

  • 動画は、RTSP、rawvideo、MP4、FLV、または MKV 形式である必要があります。
  • ビデオ コーデックは、H.264、HEVC(H.265)、rawvideo、VP9、または MPEG-4 である必要があります。

責任を持って空間分析テクノロジを使用する

責任を持って空間分析テクノロジを使用する方法については、「透明性に関するメモ」を参照してください。 Microsoft の透明性に関するメモは、AI テクノロジがどのように機能するか、またシステムのパフォーマンスと動作に影響を及ぼすシステム所有者が行う選択について理解するのに役立ちます。 ここでは、テクノロジ、人、環境などのシステム全体について考えることの重要性に焦点が当てられています。

次のステップ