Présentation d’Intelligent Video Analytics

Effectué

Chaque jour, les caméras vidéo produisent d’importants volumes de données dans des secteurs d’activité populaires. Parmi ces environnements, citons les hôpitaux, les usines, la vente au détail et les villes intelligentes. Aujourd’hui, l’IA peut améliorer la plupart de ces déploiements car elle opère en temps réel sur les données produites par les capteurs des caméras.

Imaginez la possibilité de surveiller l’application d’avis sanitaires ou le respect des protocoles de sécurité sur des chantiers, de s’adapter aux données démographiques des clients ou de répondre aux événements de trafic de manière automatisée. Vous pouvez accomplir ces tâches en utilisant des solutions basées sur la vidéo qui appliquent l’IA aux appareils de l’Internet des objets (IoT) déployés à la périphérie.

Pour désigner ces types de solutions, nous employons le terme « applications IVA (Intelligent Video Analytics) ». Les applications IVA extraient des insights actionnables en appliquant des algorithmes de vision par ordinateur qui fonctionnent sur des images vidéo en direct. Ce tableau décrit trois types d’algorithmes de vision par ordinateur :

Algorithme de vision par ordinateur Fonctionnalités
Détection d’objet Capture d’écran d’un exemple de détection d’objet avec vision par ordinateur. Les modèles de détection d’objet sont entraînés pour classifier les objets d’une image et signaler leur emplacement à l’aide d’un cadre englobant. Par exemple, une solution de suivi du trafic peut utiliser la détection d’objet pour identifier l’emplacement de différentes classes de véhicules.
Classification d’images Capture d’écran d’un exemple de classification d’images avec vision par ordinateur. La classification d’images implique l’entraînement d’un modèle de Machine Learning qui doit classifier les images en fonction de leur contenu. Prenons l’exemple d’une solution de suivi du trafic. Vous pouvez utiliser un modèle de classification d’images pour classifier les images en fonction du type de véhicule qu’elles contiennent : taxis, bus, vélos, etc.
Suivi d’objet Capture d’écran d’un exemple de suivi d’objet avec vision par ordinateur. Vous pouvez appliquer le suivi d’objet à un objet détecté par le biais de la détection d’objet. L’objet se voit attribuer une identité que vous pouvez référencer par le biais de passes d’inférence successives dans un pipeline IVA. Par exemple, vous pouvez utiliser le suivi d’objet pour compter des instances uniques de personnes dans une zone.

Vous pouvez effectuer des évaluations puissantes en combinant ces algorithmes pour obtenir une fonctionnalité appelée « inférence en cascade ». Voici un exemple de cette technique :

  1. Identifiez un véhicule et son emplacement dans le cadre en utilisant la détection d’objet.
  2. Utilisez un dispositif de suivi qui attribue à chaque véhicule un ID unique pour compter le nombre de véhicules dans la zone.
  3. Utilisez un modèle de classification d’images pour déterminer la couleur de chaque véhicule.

Une fois la génération d’insights configurée de cette façon, vous pouvez utiliser d’autres services pour exploiter ces données. Pour cela, déplacez vos données dans les services cloud dans Microsoft Azure. Sur Azure, les données peuvent faire l’objet d’un traitement en direct, déclencher des tâches d’automatisation ou être archivées en vue d’une analyse d’historique.

Activation du développement d’applications Intelligent Video Analytics en utilisant NVIDIA DeepStream et Azure

NVIDIA DeepStream vous permet de développer des applications Intelligent Video Analytics qui utilisent un framework multiplateforme que vous pouvez déployer en périphérie et connecter aux services cloud. Ce framework vous permet de définir visuellement des pipelines IVA avec un outil de développement appelé NVIDIA Graph Composer. L’outil vous permet de définir des sources vidéo à partir d’un fichier, d’une caméra locale ou de flux vidéo RTSP en réseau qui peuvent alimenter directement des opérations d’inférence uniques ou en cascade. Ces opérations produisent des insights que vous pouvez ensuite transférer à des services cloud pour un traitement ultérieur. En effectuant les tâches d’inférence lourdes en calculs localement à la périphérie, vous pouvez réduire la quantité de données nécessaires pour transmettre les insights et la télémétrie au cloud.

Diagramme montrant la périphérie DeepStream vers l’architecture cloud.

Configuration requise au niveau du matériel et du système d’exploitation

Pour continuer avec ce module, vous devez avoir accès à une machine x86/AMD64 exécutant Ubuntu 18.04. Vous devez également vérifier que l’une des cartes graphiques suivantes est installée sur votre ordinateur de développement.

GPU compatibles avec DeepStream 6.0

  • RTX 2080

  • RTX 3080

  • Tesla T4

  • Ampere A100

    Remarque

    Si vous prévoyez d’utiliser une machine virtuelle pour répondre à ces exigences, vous risquez de rencontrer des problèmes plus tard dans ce parcours d’apprentissage lorsque vous essaierez de démarrer NVIDIA Graph Composer en vous connectant à votre machine virtuelle par le biais d’une session à distance. Vous pourrez toujours continuer le module, nous voulons simplement nous assurer que vous êtes conscient de ce problème.

Essayez ceci

Tenez compte des scénarios dans lesquels vous pouvez utiliser la vision par ordinateur pour vous aider à automatiser une tâche ou à simplifier un processus traditionnellement complexe. Que doivent voir vos flux vidéo ? Quels algorithmes de vision par ordinateur devez-vous utiliser pour implémenter votre solution (détection d’objet, classification d’images, suivi d’objet) ?