Partager via


Étiquetage des images et des documents texte

Une fois que votre administrateur de projet a créé un projet d’étiquetage des données d’image Azure Machine Learning ou un projet d’étiquetage des données de texteAzure Machine Learning, vous pouvez utiliser l’outil d’étiquetage pour préparer rapidement les données pour un projet d'apprentissage automatique. Cet article aborde les points suivants :

  • Comment accéder à vos projets d’étiquetage
  • Outils d’étiquetage
  • Comment utiliser les outils pour des tâches d’étiquetage spécifiques

Prérequis

  • Un compte Microsoft ou un compte Microsoft Entra pour l’organisation et le projet.
  • Un accès de niveau contributeur à l’espace de travail qui contient le projet d’étiquetage.

Se connecter à Studio

  1. Connectez-vous à Azure Machine Learning Studio.

  2. Sélectionnez l’abonnement et l’espace de travail qui contient le projet d’étiquetage. Votre administrateur de projet dispose de ces informations

  3. Vous pourriez remarquer plusieurs sections à gauche, en fonction de votre niveau d’accès. Si c’est le cas, sélectionnez Étiquetage des données sur le côté gauche pour trouver le projet

Comprendre la tâche d’étiquetage

Dans le tableau des projets d’étiquetage des données, sélectionnez le lien Étiqueter les données associé à votre projet.

Vous disposez d’instructions spécifiques à votre projet. Ces instructions décrivent le type de données concernées, la manière dont vous devez prendre vos décisions et d’autres informations pertinentes. Lisez les informations et sélectionnez Tâches en haut de la page. Vous pouvez également sélectionner Commencer l’étiquetage au bas de la page.

Sélection d’une étiquette

Dans toutes les tâches d’étiquetage des données, vous devez choisir une ou plusieurs étiquettes appropriées parmi un ensemble spécifié par l’administrateur du projet. Vous pouvez utiliser les touches numériques du clavier pour sélectionner les neuf premières étiquettes.

Machine Learning assisté

Le processus d’étiquetage pourrait déclencher des algorithmes d’apprentissage automatique. Si ces algorithmes sont activés pour votre projet, vous pourriez voir :

  • Images

    • Après l’étiquetage d’un certain volume de données, vous pourriez remarquer des Tâches regroupées en haut de votre écran, à côté du nom du projet. Les images sont regroupées pour présenter des images similaires sur la même page. Si c’est le cas, basculez vers l’une des vues d’images multiples pour bénéficier de leur regroupement.

    • Plus tard, vous pouvez remarquer des tâches pré-étiquetées à côté du nom du projet. Les éléments s’affichent avec une suggestion d’étiquette produite par un modèle de classification Machine Learning. Aucun modèle Machine Learning n’est fiable à 100 %. Bien que nous n’utilisions que les données dans lesquelles le modèle a confiance, ces valeurs de données peuvent encore avoir des pré-étiquettes incorrectes. Lorsque vous remarquez des étiquettes, corrigez toute étiquette incorrecte avant d’envoyer la page.

    • Pour les modèles d’identification d’objet, vous pourriez remarquer des cadres englobants et des étiquettes déjà présents. Corrigez toutes les erreurs qu'elles comportent avant d’envoyer la page.

    • Pour les modèles de segmentation, vous pourriez remarquer des polygones et des étiquettes déjà présents. Corrigez toutes les erreurs qu'elles comportent avant d’envoyer la page.

  • Détails

    • Plus tard, vous pouvez remarquer des tâches pré-étiquetées à côté du nom du projet. Les éléments s’affichent avec une suggestion d’étiquette produite par un modèle de classification Machine Learning. Aucun modèle Machine Learning n’est fiable à 100 %. Bien que nous n’utilisions que les données dans lesquelles le modèle a confiance, ces valeurs de données peuvent encore avoir des pré-étiquettes incorrectes. Lorsque vous remarquez des étiquettes, corrigez les étiquettes incorrectes avant d’envoyer la page.

Au début d’un projet d’étiquetage, le modèle Machine Learning pourrait n’avoir suffisamment de précision que pour pré-étiqueter un petit sous-ensemble d’images. Une fois ces images étiquetées, le projet d’étiquetage reviendra à l’étiquetage manuel afin de collecter plus de données pour le prochain cycle de formation du modèle. Au fil du temps, le modèle sera davantage fiable pour un plus grand nombre d’images. Plus tard dans le projet, sa confiance se traduit par davantage de tâches de pré-étiquetage.

Lorsqu’il n’y a plus de tâches pré-étiquetées, la confirmation ou le processus de correction d’étiquette s’arrête et retourne au balisage manuel des éléments.

Tâches liées aux images

Dans les tâches de classification d’images, vous pouvez choisir de voir plusieurs images simultanément. Pour sélectionner la disposition, utilisez les icônes situées au-dessus de la zone d’image.

Pour sélectionner toutes les images affichées simultanément, utilisez Tout sélectionner. Pour sélectionner des images individuelles, utilisez le bouton de sélection circulaire situé en haut à droite de l’image. Pour appliquer une balise, vous devez sélectionner au moins une image. Si vous sélectionnez plusieurs images, toutes les étiquettes que vous sélectionnez s’appliquent à l’ensemble des images sélectionnées.

Par exemple, nous pouvons choisir une disposition deux par deux et appliquer la balise « Mammifère » aux images ours et orque, comme illustré dans cette capture d’écran :

Capture d’écran montrant la sélection de plusieurs images.

Cela montre plusieurs dispositions et sélections d’images. L’image du requin a déjà été étiquetée comme « poisson cartilagineux », et l’iguane n’a pas encore d’étiquette.

Important

Ne changez de mise en page que lorsque vous avez une nouvelle page de données non étiquetées. Le changement de mise en page efface le travail d’étiquetage en cours de la page.

Une fois que vous avez étiqueté toutes les images de la page, Azure active le bouton Envoyer. Sélectionnez Envoyer pour enregistrer votre travail.

Une fois que vous avez envoyé les étiquettes relatives aux données disponibles, Azure actualise la page en affichant un nouvel ensemble d’images provenant de la file d’attente de travail.

Tâches liées aux images médicales

Important

La fonctionnalité permettant d’étiqueter des images DICOM ou de types similaires n’est pas destinée à être utilisée en tant que dispositif médical, support clinique, outil de diagnostic ou autre technologie destinée à être utilisée dans le diagnostic, la guérison, l’atténuation, le traitement ou la prévention de maladies ou d’autres conditions, et aucune licence ou droit n’est accordé par Microsoft pour utiliser cette fonctionnalité à ces fins. Cette fonctionnalité n’est pas conçue ou destinée à être mise en œuvre ou déployée en remplacement de conseils médicaux professionnels ou d’avis de santé, de diagnostic, de traitement ou de jugement clinique d’un professionnel de la santé, et ne doit pas être utilisé en tant que tel. Le client est seul responsable de l’utilisation de l’étiquetage des données pour des images DICOM ou de types similaires.

Les projets d’images prennent en charge le format d’image DICOM pour les images de fichiers X-ray, comme illustré dans cette capture d’écran :

Capture d’écran montrant une image DICOM X-ray à étiqueter.

Alors que vous étiquetez les images médicales avec les mêmes outils que pour les autres images, vous pouvez utiliser un outil différent pour les images DICOM, comme illustré dans cette capture d’écran :

Capture d’écran montrant l’outil de fenêtre et de niveau pour les images DICOM.

Sélectionnez l’outil Fenêtre et niveau pour changer l’intensité de l’image. Cet outil est disponible uniquement pour les images DICOM.

Étiqueter des images pour une classification multiclasse

Attribuez une seule étiquette à l’image entière pour un type de projet « Classification d’images multi-classes ». Pour passer en revue les instructions à tout moment, accédez à la page Instructions, puis sélectionnez Afficher les instructions détaillées.

Si vous vous rendez compte que vous avez commis une erreur après avoir affecté une étiquette à une image, vous pouvez la corriger. Sélectionnez le « X » sur l’étiquette affichée sous l’image pour effacer l’étiquette. Vous pouvez également sélectionner l’image et choisir une autre classe. La nouvelle valeur sélectionnée remplace l’étiquette précédemment appliquée.

Étiqueter des images pour une classification multiétiquette

Si votre projet est de type « Classification multi-étiquettes des images », vous appliquez une ou plusieurs étiquettes à une image. Pour voir les instructions spécifiques au projet, sélectionnez Instructions, puis accédez à Afficher les instructions détaillées.

Sélectionnez l’image que vous voulez étiqueter, puis sélectionnez l’étiquette. L’étiquette est appliquée à toutes les images sélectionnées, puis les images sont désélectionnées. Pour appliquer d’autres balises aux images, vous devez les resélectionner. Cette animation illustre un balisage à plusieurs étiquettes :

Animation montrant le balisage multi-étiquette.

L’animation montre que

  1. L’option Sélectionner tout permet d’appliquer la balise « Ocean » (Océan)
  2. Une seule image est sélectionnée et balisée « Closeup » (Gros plan)
  3. Trois images sont sélectionnées et balisées « Wide angle » (Grand angle)

Pour corriger une erreur, sélectionnez le « X » afin d’effacer une étiquette individuelle, ou sélectionnez les images nécessaires, puis l’étiquette, ce qui permet d’effacer l’étiquette de toutes les images sélectionnées. Ce scénario est illustré ici. En sélectionnant « Land » (Terre), vous effacez cette étiquette des deux images sélectionnées. Cette capture d’écran illustre le scénario :

Capture d’écran montrant l’élimination des balises de plusieurs images sélectionnées.

Azure n’activera le bouton Envoyer qu’après que vous aurez appliqué au moins une étiquette à chaque image. Sélectionnez Envoyer pour enregistrer votre travail.

Étiqueter des images et spécifier des cadres englobants pour la détection d’objet

Si votre projet est de type « Identification d’objets (cadres englobants) », spécifiez un ou plusieurs cadres englobants dans l’image, puis appliquez une étiquette à chaque cadre. Les images peuvent avoir plusieurs cadres englobants, chacun associé à une seule étiquette. Utilisez Afficher les instructions détaillées pour déterminer si votre projet utilise plusieurs cadres englobants.

  1. Sélectionnez une balise pour le cadre englobant que vous prévoyez de créer

  2. Sélectionnez « R », ou sélectionnez l’outil Cadre rectangulaire, comme illustré dans cette capture d’écran :

    Capture d’écran montrant la sélection de l’outil Cadre rectangulaire.

  3. Pour créer un cadre englobant approximatif, sélectionnez et faites glisser en diagonale sur votre cible. Faites glisser les bords ou les angles pour ajuster la cadre englobante, comme illustré dans cette capture d’écran :

    Capture d’écran montrant la création d’un cadre englobant.

Pour supprimer un cadre englobant, sélectionnez la cible en forme de X qui apparaît à côté du cadre après sa création.

Vous ne pouvez pas changer l’étiquette d’un cadre englobant. Pour réparer une erreur d’affectation d’étiquette, vous devez supprimer le cadre englobant et en créer un nouveau avec l’étiquette appropriée.

Par défaut, vous pouvez modifier les cadres englobants existants. L’outil « L » ou Verrouiller/déverrouiller les régions bascule ce comportement, comme illustré dans cette capture d’écran :

Capture d’écran montrant la sélection de l’outil Verrouiller/déverrouiller les régions.

Si les zones sont verrouillées, vous pouvez uniquement changer la forme ou l’emplacement d’un nouveau cadre englobant.

L’outil Manipulation de régions se compose de quatre flèches qui commencent du centre et pointent vers le haut, vers le bas, vers la droite et vers la gauche, comme illustré dans cette capture d’écran :

Capture d’écran montrant la sélection de l’outil Manipulation de régions.

Utilisez l’outil Manipulation de régions ou « M » pour ajuster un cadre englobant existant. Pour ajuster la forme, faites glisser ses bords ou ses angles. Cliquez à l’intérieur si vous voulez faire glisser l’ensemble du cadre englobant. Si vous ne pouvez pas modifier une zone, c’est que vous avez probablement inversé le comportement de l’outil Verrouiller/déverrouiller des zones.

L’outil Cadre basé sur un modèle crée plusieurs cadres englobants de la même taille, comme illustré dans cette capture d’écran :

Capture d’écran montrant la sélection de l’outil Cadre basé sur un modèle.

Utilisez l’outil Cadre basé sur un modèle, ou « T », pour créer plusieurs cadres englobants de même taille. Si l’image ne contient pas de cadre englobant et si vous activez les cadres basés sur un modèle, l’outil génère des cadres de 50 x 50 pixels. Si vous créez un cadre englobant, puis que vous activez les cadres basés sur un modèle, les nouveaux cadres englobants ont la taille du dernier cadre créé. Vous pouvez redimensionner les cadres basées sur des modèles après le placement. Le redimensionnement d’un cadre basé sur un modèle entraîne uniquement le redimensionnement de ce cadre.

Pour supprimer tous les cadres englobants de l’image active, sélectionnez l’outil Supprimer toutes les régions comme illustré dans cette capture d’écran :

Capture d’écran montrant la sélection de l’outil Supprimer toutes les régions.

Après avoir créé les cadres englobants d’une image, sélectionnez Envoyer pour enregistrer votre travail. Sinon, ce dernier ne sera pas enregistré.

Étiqueter des images et spécifier des polygones pour la segmentation des images

Si votre projet est de type « Segmentation d’instance (polygone) », spécifiez un ou plusieurs polygones dans l’image et appliquez une étiquette à chacun de ces polygones. Les images peuvent avoir plusieurs polygones englobants, chacun étant associé à une seule étiquette. Utilisez Afficher les instructions détaillées pour déterminer si votre projet utilise des polygones englobants multiples.

  1. Sélectionnez une balise pour le polygone que vous prévoyez de créer
  2. Sélectionnez « P » ou sélectionnez l’outil Dessiner la région de polygone, comme illustré dans cette capture d’écran :

Capture d’écran montrant la sélection de l’outil Dessiner la région de polygone.

  1. Sélectionnez chaque point du polygone. Lorsque vous terminez la forme, sélectionnez deux fois pour terminer, comme illustré dans cette animation :

    Créer des polygones pour le chat et le chien.

Pour supprimer un polygone, sélectionnez la cible en forme de X qui s’affiche à côté du polygone après sa création.

Pour modifier l’étiquette d’un polygone, sélectionnez l’outil Déplacer les régions, sélectionnez le polygone, puis sélectionnez l’étiquette correcte.

Vous pouvez modifier les polygones existants. L’outil Verrouiller/déverrouiller les régions , ou « L », bascule ce comportement, comme illustré dans cette capture d’écran :

Capture d’écran montrant la sélection de l’outil Verrouiller/Déverrouiller les régions.

Si les régions sont verrouillées, vous pourrez uniquement changer la forme ou l’emplacement des nouveaux polygones.

Utilisez l’outil Ajouter ou supprimer des points de polygones, ou « U », pour ajuster un polygone existant, comme illustré dans cette capture d’écran :

Capture d’écran montrant la sélection de l’outil Verrouiller/Déverrouiller les régions.

Sélectionnez le polygone pour ajouter ou supprimer un point. Si vous ne pouvez pas modifier une zone, c’est que vous avez probablement inversé le comportement de l’outil Verrouiller/déverrouiller des zones.

Pour supprimer tous les cadres englobants de l’image active, sélectionnez l’outil Supprimer toutes les régions comme illustré dans cette capture d’écran :

Capture d’écran montrant la suppression de toutes les régions.

Après avoir créé les polygones d’une image, sélectionnez Envoyer pour enregistrer votre travail. Sinon, ce dernier ne sera pas enregistré.

Étiqueter des images et dessiner des masques pour la segmentation sémantique

Si votre projet est de type « Segmentation sémantique (préversion) », utilisez le pinceau pour peindre un masque sur la zone que vous souhaitez étiqueter.

  1. Sélectionnez une balise pour la zone sur laquelle vous voulez peindre

  2. Sélectionnez l’outil Pinceau, comme illustré dans cette capture d’écran :

    Capture d’écran montrant la sélection de l’outil Pinceau.

  3. Sélectionnez l’outil taille pour choisir une taille pour votre pinceau, comme illustré dans cette capture d’écran :

    Capture d’écran montrant la sélection de la taille de pinceau.

  4. Peindre sur la zone que vous souhaitez étiqueter. La couleur correspondant à votre balise sera appliquée à la zone sur laquelle vous peignez

    Capture d’écran de la zone de peinture pour les visages de chat et de chien pour la segmentation sémantique.

Pour supprimer des parties de la zone, sélectionnez l’outil Gomme.

Pour modifier la balise d’une zone, sélectionnez la nouvelle balise et repeignez la zone.

Vous pouvez également utiliser l’outil Polygon pour spécifier une région.

Après avoir créé les zones d’une image, sélectionnez Envoyer pour enregistrer votre travail. Sinon, ce dernier ne sera pas enregistré. Si vous avez utilisé l’outil Polygone, tous les polygones sont convertis en masque lorsque vous envoyez.

Texte d'étiquette

Lorsque vous étiquetez du texte, utilisez la barre d’outils pour effectuer les actions suivantes :

  • Augmenter ou diminuer la taille du texte
  • Modifier la police
  • Ignorer l’étiquetage d’un élément et passer au suivant

Si vous remarquez que vous avez affecté la mauvaise étiquette, vous pouvez la corriger. Sélectionnez le « X » sur la balise affichée sous l’image, pour effacer la balise.

Il existe trois types de projets texte :

Type de projet Description
Classification multiclasse Attribuez une seule étiquette à la totalité de l’entrée de texte. Vous ne pouvez sélectionner qu’une seule étiquette par élément. Sélectionnez une étiquette, puis sélectionnez Envoyer pour passer à l’entrée suivante.
Classification multiétiquette Attribuez une ou plusieurs étiquettes à chaque entrée de texte. Vous pouvez sélectionner plusieurs étiquettes par élément. Sélectionnez toutes les étiquettes applicables, puis sélectionnez Envoyer pour passer à l’entrée suivante.
Reconnaissance d’entité nommée Étiquetez différents mots ou expressions dans chaque entrée de texte. Voir les instructions dans la section suivante.

Pour voir les instructions spécifiques au projet, sélectionnez Instructions, puis accédez à Afficher les instructions détaillées.

Étiqueter des mots et expressions

Si votre projet est configuré pour la reconnaissance d’entité nommée, vous étiquetez des mots ou expressions différents dans chaque élément de texte. Pour étiqueter du texte :

  1. Sélectionnez l’étiquette ou tapez le numéro correspondant à l’étiquette appropriée
  2. Double-cliquez sur un mot ou utilisez la souris pour en sélectionner plusieurs.

Capture d’écran : Reconnaissance d’entité nommée.

Pour modifier une étiquette, vous pouvez :

  • Supprimer l’étiquette, puis recommencer.
  • Modifier la valeur d’une partie ou de la totalité d’une étiquette spécifique dans votre élément actif :
    • Sélectionnez l’étiquette elle-même. Cela a pour effet de sélectionner toutes les instances de cette étiquette.
    • Pour désélectionner les instances que vous voulez conserver, sélectionnez à nouveau les instances de cette balise.
    • Enfin, sélectionnez une nouvelle étiquette pour modifier toutes les étiquettes qui sont toujours sélectionnées.

Après avoir étiqueté tous les éléments d’une entrée, sélectionnez Envoyer pour passer à l’entrée suivante.

Terminer

Quand vous envoyez une page de données marquées, Azure vous affecte de nouvelles données non étiquetées en provenance d’une file d’attente de travail. S’il ne reste plus de données non étiquetées, un nouveau message l’indique, ainsi qu’un lien vers la page d’accueil du portail.

Une fois l’étiquetage terminé, sélectionnez votre image à l’intérieur d’un cercle dans le coin supérieur droit du studio, puis sélectionnez Déconnexion. Si vous ne vous déconnectez pas, Azure fait expirer votre session et attribue vos données à un autre étiqueteur.

Étapes suivantes