Introduzione a Intelligent Video Analytics
Ogni giorno, le videocamere producono grandi volumi di dati nei domini aziendali più diffusi, Queste aree includono ambienti ospedalieri, di produzione, vendita al dettaglio e smart city. Molte di queste distribuzioni possono essere migliorate con l'aggiunta dell'intelligenza artificiale che opera sui dati prodotti dai sensori delle videocamere in tempo reale.
Si immagini di avere la possibilità di monitorare l'applicazione delle raccomandazioni sanitarie o il rispetto dei protocolli di sicurezza nei luoghi di lavoro, di adattarsi ai dati demografici dei clienti o di rispondere agli eventi del traffico in modo automatizzato. È possibile realizzare questi scenari usando soluzioni basate su video che applicano l'intelligenza artificiale ai dispositivi Internet delle cose distribuiti sul perimetro.
Questi tipi di soluzioni sono note come applicazioni IVA (Intelligent Video Analytics). Estraggono informazioni dettagliate su cui è possibile intervenire tramite l'applicazione di algoritmi di visione artificiale che operano su fotogrammi video live. Questa tabella descrive tre tipi di algoritmi di visione artificiale:
Algoritmo di visione artificiale | Funzionalità |
---|---|
Rilevamento oggetti ![]() |
I modelli di rilevamento oggetti sono sottoposti a training per classificare singoli oggetti in un'immagine e identificarne la posizione con un rettangolo delimitatore. Una soluzione di monitoraggio del traffico può ad esempio usare il rilevamento oggetti per identificare la posizione di vari tipi di veicoli. |
Classificazione immagini ![]() |
La classificazione immagini comporta il training di un modello di Machine Learning per classificare le immagini in base al rispettivo contenuto. Si consideri ad esempio una soluzione di monitoraggio del traffico. Si potrebbe usare un modello di classificazione delle immagini per classificare le immagini in base al tipo di veicolo contenuto, ad esempio taxi, bus, biciclette e così via. |
Rilevamento degli oggetti ![]() |
È possibile applicare il tracciamento oggetti a un oggetto rilevato tramite il rilevamento oggetti. All'oggetto viene assegnata un'identità a cui è possibile fare riferimento tramite passaggi di inferenza successivi in una pipeline IVA. Ad esempio, è possibile usare il tracciamento oggetti per contare le istanze univoche di persone in un'area. |
È possibile eseguire valutazioni di grande efficacia usando questi algoritmi in combinazione per ottenere funzionalità note come inferenza a catena. Ecco un esempio di questa tecnica:
- Identificare un veicolo e la relativa posizione nel fotogramma usando il rilevamento oggetti.
- Usare un tracker che assegna a ogni veicolo un ID univoco per contare il numero di veicoli nell'area.
- Usare un modello di classificazione immagini per determinare il colore di ogni veicolo.
Dopo aver configurato la soluzione per generare informazioni dettagliate in questo modo, è possibile ricorrere a ulteriori servizi per usare questi dati tramite l'offload nei servizi cloud in Microsoft Azure. In Azure i dati possono essere elaborati in tempo reale, attivare attività di automazione o essere archiviati per l'analisi cronologica.
Abilitazione dello sviluppo di applicazioni IVA (Intelligent Video Analytics) tramite NVIDIA DeepStream e Azure
NVIDIA DeepStream consente di sviluppare applicazioni IVA (Intelligent Video Analytics) che usano un framework multipiattaforma che può essere distribuito sul perimetro e connettersi ai servizi cloud. Questo framework consente di definire visivamente le pipeline IVA usando uno strumento di sviluppo denominato NVIDIA Graph Composer. Lo strumento consente di definire origini video da file, videocamera locale o flussi video RTSP di rete che possono essere inseriti direttamente in operazioni di inferenza a catena o singole. Queste operazioni producono informazioni dettagliate che è quindi possibile inoltrare ai servizi cloud per un'ulteriore elaborazione. Eseguendo le attività di inferenza pesanti a livello di calcolo in locale sul perimetro, è possibile ridurre la quantità di dati necessari per trasmettere informazioni dettagliate e dati di telemetria al cloud.
Requisiti per hardware e sistema operativo
Per continuare con questo modulo, è necessario avere accesso a un computer basato su x86/AMD64 che esegue Ubuntu 18.04. È anche necessario assicurarsi che nel computer di sviluppo sia installata una delle schede grafiche seguenti.
GPU compatibili con DeepStream 6.0
-
Nota
Se si prevede di usare una macchina virtuale per soddisfare questi requisiti, si potrebbero riscontrare problemi più avanti in questo percorso di apprendimento quando si tenta di avviare NVIDIA Graph Composer se si esegue la connessione alla macchina virtuale tramite una sessione remota. Sarà comunque possibile continuare con il modulo, ma è importante tenere conto di questo potenziale problema.
Prova
Prendere in considerazione gli scenari in cui è possibile usare la visione artificiale per automatizzare un'attività o semplificare un processo tradizionalmente complesso. Cosa devono vedere i feed video? Quali algoritmi di visione artificiale è necessario usare per implementare la soluzione (rilevamento oggetti, classificazione immagini, tracciamento oggetti)?