Créer des solutions de vision par ordinateur avec Azure AI Vision

Intermédiaire
Ingénieur IA
Développeur
Azure AI services
Vision par ordinateur Azure
Visage Azure
Azure AI Video Indexer

La vision par ordinateur est un aspect de l’intelligence artificielle qui concerne la perception visuelle. Azure AI Vision comprend plusieurs services qui prennent en charge les scénarios courants de vision par ordinateur.

Prérequis

Avant de commencer ce parcours d’apprentissage, vous devrez déjà :

  • Connaître Azure et le portail Azure.
  • Avoir une expérience de la programmation avec C# ou Python. Si vous n’avez pas d’expérience en programmation, nous vous recommandons de suivre le parcours d’apprentissage Faites vos premiers pas avec C# ou Premiers pas avec Python avant de démarrer celui-ci.

Modules de ce parcours d’apprentissage

Avec le service Azure AI Vision, vous pouvez utiliser des modèles préformés pour analyser des images et extraire des insights et des informations à partir de celles-ci.

Classer les images en formant un modèle personnalisé avec Azure AI Vision.

La classification d’images est utilisée pour déterminer l’objet principal d’une image. Vous pouvez utiliser les services Azure AI Custom Vision pour effectuer l’apprentissage d’un modèle qui classifie des images en fonction de vos propres catégorisations.

La détection des objets permet de localiser et d’identifier des objets dans des images. Vous pouvez utiliser Azure AI Custom Vision pour former un modèle afin de détecter des types d’objets spécifiques dans des images.

La capacité des applications à détecter les visages humains, à analyser les caractéristiques faciales et les émotions et à identifier les individus est une fonctionnalité d’intelligence artificielle clé.

Le service Azure AI Vision utilise des algorithmes pour traiter des images et retourner des informations. Ce module vous explique comment utiliser l’API Analyse d’images pour la reconnaissance optique de caractères (OCR).

Azure Video Indexer est un service permettant d’extraire des informations des vidéos, dont l’identification des visages, la reconnaissance de texte, les étiquettes d’objets, la segmentation des scènes, etc.