Introdução ao Intelligent Video Analytics

Concluído

Todos os dias, as câmeras de vídeo produzem volumes de dados em domínios de negócios populares. Essas áreas incluem ambientes hospitalares, de manufatura, de varejo e de cidades inteligentes. Muitas dessas implantações podem ser aprimoradas com a adição de IA que opera sobre os dados produzidos pelos sensores da câmera em tempo real.

Imagine ser capaz de monitorar o cumprimento de avisos de saúde ou a adesão aos protocolos de segurança nos locais de trabalho, adaptar-se à demografia dos clientes ou responder a eventos de trânsito de forma automatizada. Você pode realizar esses cenários usando soluções baseadas em vídeo que aplicam IA a dispositivos de Internet das Coisas implantados na borda.

Referimo-nos a estes tipos de soluções como aplicações Intelligent Video Analytics (IVA). Eles extraem insights acionáveis através da aplicação de algoritmos de visão computacional que operam em quadros de vídeo ao vivo. Esta tabela descreve três tipos de algoritmos de visão computacional:

Algoritmo de visão computacional Capacidades
Deteção de objetos Captura de tela que mostra um exemplo de deteção de objetos com visão computacional. Os modelos de deteção de objetos são treinados para classificar objetos individuais em uma imagem e identificar sua localização com uma caixa delimitadora. Por exemplo, uma solução de monitorização de tráfego pode utilizar a deteção de objetos para identificar a localização de várias classes de veículos.
Classificação das imagens Captura de tela que mostra um exemplo de classificação de imagem com visão computacional. A classificação de imagens envolve o treinamento de um modelo de aprendizado de máquina para classificar imagens com base em seu conteúdo. Por exemplo, considere uma solução de monitoramento de tráfego. Você pode usar um modelo de classificação de imagens para classificar imagens com base no tipo de veículo que elas contêm, como táxis, ônibus, bicicletas e assim por diante.
Rastreamento de objetos Captura de tela que mostra um exemplo de rastreamento de objetos com visão computacional. Você pode aplicar o rastreamento de objetos a um objeto detetado por meio da deteção de objetos. O objeto recebe uma identidade que você pode referenciar através de sucessivas passagens de inferência em um pipeline de IVA. Por exemplo, você pode usar o rastreamento de objetos para contar instâncias exclusivas de pessoas em uma área.

Você pode fazer avaliações poderosas usando esses algoritmos em combinação para obter a funcionalidade conhecida como inferência em cascata. Aqui está um exemplo dessa técnica:

  1. Identifique um veículo e sua localização no quadro usando a deteção de objetos.
  2. Use um rastreador que atribui a cada veículo um ID exclusivo para contar o número de veículos na área.
  3. Use um modelo de classificação de imagem para determinar a cor de cada veículo.

Depois de configurar para gerar insights dessa maneira, você pode empregar mais serviços para usar esses dados descarregando para serviços de nuvem no Microsoft Azure. No Azure, os dados podem ser processados em tempo real, acionar tarefas de automação ou ser arquivados para análise histórica.

Habilitando o desenvolvimento de aplicativos de análise de vídeo inteligente usando o NVIDIA DeepStream e o Azure

O NVIDIA DeepStream permite que você desenvolva aplicativos de análise de vídeo inteligente que usam uma estrutura multiplataforma que você pode implantar na borda e se conectar a serviços de nuvem. Essa estrutura permite que você defina visualmente pipelines IVA usando uma ferramenta de desenvolvimento chamada NVIDIA Graph Composer. A ferramenta permite que você defina fontes de vídeo de arquivos, câmera local ou fluxos de vídeo RTSP em rede que podem alimentar diretamente em operações de inferência única ou em cascata. Essas operações produzem informações que você pode encaminhar para serviços de nuvem para processamento posterior. Ao realizar as tarefas de inferência computacionalmente pesadas localmente na borda, você pode reduzir a quantidade de dados necessários para transmitir insights e telemetria para a nuvem.

Diagrama que mostra a borda do DeepStream para a arquitetura de nuvem.

Requisitos de hardware e sistema operacional

Para continuar com este módulo, você precisa ter acesso a uma máquina baseada em x86/AMD64 executando o Ubuntu 18.04. Você também precisa garantir que sua máquina de desenvolvimento tenha uma das seguintes placas gráficas instaladas.

GPUs compatíveis com DeepStream 6.0

  • RTX 2080 |

  • RTX 3080

  • Tesla T4

  • Ampere A100

    Nota

    Se você planeja usar uma máquina virtual para atender a esses requisitos, poderá encontrar problemas mais tarde neste caminho de aprendizado ao tentar iniciar o NVIDIA Graph Composer se estiver se conectando à sua VM por meio de uma sessão remota. Você ainda poderá continuar com o módulo, mas queremos ter certeza de que você está ciente desse problema.

Experimente isto

Considere cenários em que você pode usar a visão computacional para ajudá-lo a automatizar uma tarefa ou simplificar um processo tradicionalmente complexo. O que seus feeds de vídeo precisariam ver? Quais algoritmos de visão computacional você precisaria usar para implementar sua solução (deteção de objetos, classificação de imagens, rastreamento de objetos)?