Melhorar o desempenho do modelo de classificação de categorias
Se o desempenho do modelo não for a desejada, poderá experimentar alguns passos. Estas sugestões podem ajudar a ajustar o modelo para melhorar a capacidade de previsão.
Adicionar dados de treino rotulados mais corretamente
Quanto mais corretamente os dados de formação tiverem sido rotulados, mellhor será o desempenho do modelo. Por exemplo, digamos que tem uma etiqueta Sim/Não. Se a maioria dos dados apenas tiver um Sim nesta coluna, o modelo de IA provavelmente não aprenderá muito com estes dados. Se os dados não forem rotulados corretamente, é provável que o modelo não aprenda muito corretamente. O ideal é começar com um pequeno conjunto de exemplos corretamente etiquetados – talvez 100 ou menos. A partir daí, pode continuar a duplicar o número de exemplos iterativamente e a retreinar cada vez, observando a mudança de desempenho. De um modo geral, mais dados é melhor, mas há retornos cada vez menores para adicionar dados quanto maior o seu conjunto de dados obtém.
Mais sugestões
- Certifique-se de que a utilização de etiquetas é equilibrado nos dados de preparação. Por exemplo: tem quatro etiquetas para 100 itens de texto. As duas primeiras etiquetas (tag1 e tag2) são utilizadas para 90 itens de texto, mas as outras duas (tag3 e tag4) são utilizadas apenas nos restantes 10 itens de texto. A falta de equilíbrio pode fazer com que o seu modelo tenha dificuldades em prever corretamente a tag3 ou a tag4.
- Certifique-se de que prepara o seu modelo usando dados semelhantes para o que espera utilizar o modelo.
Próximo passo
Publicar o modelo de classificação de categoria