インテリジェントなビデオ分析の概要
一般的なビジネス領域では毎日、ビデオ カメラで大量のデータが生成されています。 これらの領域には病院、製造、小売、およびスマート シティ環境が含まれます。 これらのデプロイの多くは、カメラ センサーによって生成されたデータをリアルタイムで操作する AI を追加することで拡張できます。
現場での正常性の勧告や安全手順への準拠を監視したり、顧客の人口統計を調整したり、交通事象に自動的に対処したりすることができると想像してみてください。 これらのシナリオは、エッジにデプロイされたモノのインターネット デバイスに AI を適用するビデオベースのソリューションを使用することで実現できます。
これらの種類のソリューションは、''インテリジェントなビデオ分析 (IVA)'' アプリケーションと呼ばれています。 ライブ ビデオ フレームを操作するコンピューター ビジョン アルゴリズムの適用によって、実用的な分析情報が抽出されます。 次の表では、3 種類のコンピューター ビジョン アルゴリズムについて説明します。
コンピューター ビジョン アルゴリズム | 機能 |
---|---|
物体検出 ![]() |
物体検出モデルは、画像の個々の物体を分類し、その位置を境界ボックスで特定するようにトレーニングされます。 たとえば、交通監視ソリューションでは、物体検出を使用して、さまざまなクラスの車両の位置を特定します。 |
画像分類 ![]() |
画像分類では、機械学習モデルをトレーニングして、その内容に基づいて画像を分類します。 たとえば、交通監視ソリューションについて考えてみます。 画像分類モデルを使用して、タクシー、バス、自転車のような、画像に含まれる車両の種類に基づいて画像を分類できます。 |
物体追跡 ![]() |
物体追跡は、物体検出によって検出された物体に適用できます。 物体には、IVA パイプラインの一連の推論パスを通じて参照できる ID が割り当てられます。 たとえば、物体追跡を使用して、ある領域内の人物の一意のインスタンスをカウントすることができます。 |
これらのアルゴリズムを組み合わせて使用することで、強力な評価を行うことができます。これにより、''カスケード推論'' と呼ばれる機能が実現します。 この手法の例を以下に示します。
- 物体検出を使用して、フレーム内の車両とその場所を特定します。
- 各車両に一意の ID を割り当てて、その領域内の車両数をカウントするためにトラッカーを使用します。
- 画像分類モデルを使用して、各車両の色を判断します。
この方法で分析情報が得られるように設定した後、Microsoft Azure でクラウド サービスにオフロードすることで、このデータを使用するためにより多くのサービスを採用できます。 Azure では、データをライブ処理したり、自動化タスクをトリガーしたり、履歴分析のためにアーカイブしたりすることができます。
NVIDIA DeepStream と Azure を使用してインテリジェントなビデオ分析アプリケーションの開発を可能にする
NVIDIA DeepStream を使用すると、エッジでデプロイしてクラウド サービスに接続できるマルチプラットフォーム フレームワークを使用するインテリジェントなビデオ分析アプリケーションを開発できます。 このフレームワークを使用すると、NVIDIA Graph Composer という開発ツールを使用して、IVA パイプラインを視覚的に定義できます。 このツールを使用すると、単一またはカスケード推論操作に直接フィードできるファイル、ローカル カメラ、またはネットワークに接続された RTSP ビデオ ストリームからのビデオ ソースを定義できます。 これらの操作により、さらに処理するためにクラウド サービスに転送できる分析情報が得られます。 エッジで計算負荷の高い推論タスクをローカルに実行することにより、分析情報やテレメトリをクラウドに送信するために必要なデータの量を減らすことができます。
ハードウェアとオペレーティング システムの要件
このモジュールを続行するには、Ubuntu 18.04 を実行している X86/AMD64 ベースのコンピューターにアクセスできる必要があります。 また、開発用コンピューターに、次のいずれかのグラフィックス カードがインストールされていることを確かめる必要もあります。
DeepStream 6.0 と互換性のある GPU
-
Note
これらの要件を満たすために仮想マシンを使用する予定がある場合は、リモート セッション経由で VM に接続している場合に NVIDIA Graph Composer を開始しようとすると、このラーニング パスの後半で問題が発生する可能性があります。 それでもモジュールを続行できますが、必ずこの問題を認識するようにしてください。
次の操作を試してみてください
コンピューター ビジョンを使用すると、タスクを自動化したり、従来の複雑なプロセスを簡略化したりするのに役立つ可能性があるシナリオについて考えてみます。 ビデオ フィードで何を確認する必要がありますか? ソリューションを実装するためにどのようなコンピューター ビジョン アルゴリズムを使用する必要がありますか (物体検出、画像分類、物体追跡)?