Améliorer les performances du modèle de classification par catégorie
Si les performances de votre modèle ne vous conviennent pas, il reste quelques petites choses à essayer. Ces conseils peuvent vous aider à affiner votre modèle afin d’améliorer son pouvoir prédictif.
Ajouter des données de formation plus correctement étiquetées
Plus vos données de formation sont correctement étiquetées, meilleures seront les performances de votre modèle. Par exemple, disons que vous avez une étiquette Oui/Non. Si la plupart de vos données ne comportent qu’un Oui dans cette colonne, votre modèle IA n’apprendra probablement pas grand-chose de ces données. Si vos données ne sont pas correctement étiquetées, le modèle n’apprendra probablement pas très bien. Il est idéal de commencer avec un petit ensemble d’exemples correctement étiquetés – peut-être 100 ou moins. À partir de là, vous pouvez continuer de doubler le nombre d’exemples de manière itérative et de vous recycler à chaque fois, en notant le changement de performances. De manière générale, plus il y a de données, mieux c’est, mais il y a des rendements décroissants pour l’ajout de données plus votre ensemble de données est volumineux.
Plus astuces
- Assurez-vous d’utiliser de façon équilibrée les balises de vos données de formation. Par exemple : vous disposez de quatre balises pour 100 éléments de texte. Les deux premières balises (tag1 et tag2) sont utilisés pour 90 éléments de texte, mais les deux autres (tag3 et tag4) ne sont utilisées que sur les 10 éléments de texte restants. Le manque d’équilibre peut empêcher votre modèle de prédire correctement tag3 ou tag4.
- Assurez-vous d’entraîner votre modèle à l’aide de données similaires à celles pour lesquelles vous prévoyez d’utiliser le modèle.
Étape suivante
Publier votre modèle de classification par catégorie