Compartilhar via


Aprimorar o desempenho do seu modelo de classificação de categoria

Se o desempenho do modelo não estiver onde você deseja, algumas medidas poderão ser tomadas. Estas dicas podem ajudá-lo a ajustar seu modelo para melhorar a capacidade de previsão.

Adicionar dados de treinamento rotulados corretamente

Quanto mais dados de treinamento forem rotulados corretamente, melhor será o desempenho do seu modelo. Por exemplo, digamos que você tenha um rótulo Sim/Não. Se a maioria dos seus dados tiver apenas Sim nessa coluna, o modelo de IA provavelmente não aprenderá muito com esses dados. Se seus dados não estiverem corretamente rotulados, o modelo provavelmente não vai aprender muito bem. É ideal começar com um pequeno conjunto de exemplos rotulados corretamente – talvez 100 ou menos. A partir daí, você poderá continuar duplicando o número de exemplos iterativamente e readaptado a cada vez, observando a alteração no desempenho. De um modo geral, ter mais dados é melhor, mas há retornos decrescentes para adicionar dados quanto maior o seu conjunto de dados.

Mais dicas

  • Equilibre o uso de marcas em seus dados de treinamento. Por exemplo: você tem quatro marcas para 100 itens de texto. As duas primeiras marcas (tag1 e tag2) são usadas para 90 itens de texto, mas os outros dois (tag3 e tag4) são usados somente nos 10 itens de texto restantes. A falta de equilíbrio pode fazer com que seu modelo lute para prever corretamente tag3 ou tag4.
  • Treine seu modelo usando dados semelhantes aos dados para os quais você espera usar o modelo.

Próxima etapa

Publicar seu modelo de classificação de categorias

Modelo predefinido de classificação de categorias