提高您的类别分类模型的性能
如果模型性能不是你想要的,可以尝试一些操作。 这些提示可帮助您调整模型以提高其预测能力。
添加更正确标记的训练数据
您拥有的训练数据标记越正确,模型的性能就越好。 例如,假设您有一个“是/否”标签。 如果在此列中,大部分数据只有是,则 AI 模型可能无法从这些数据中了解到什么。 如果您的数据没有正确标记,该模型的学习效果可能不太好。 最好从一小组正确标记的示例(可以是 100 个或更少)开始。 可以从这里继续以迭代方式对示例数量翻倍,并且每次进行重新训练,并记录性能变化。 一般说来,数据越多效果越好,但是数据集变得越大,添加数据的结果越少。
更多提示
- 请确保在训练数据时均衡使用标记。 例如:100 个文本项有四个标记。 前两个标记(tag1 和 tag2)用于 90 个文本项,但另两个标记(tag3 和 tag4)仅用于其余 10 个文本项。 失衡可能导致模型难以正确预测 tag3 或 tag4。
- 请确保使用与预期要将模型用于的数据类似的数据训练模型。