摘要
我们花了一些时间研究如何改进复杂的分类模型,包括平衡数据和不平衡数据。 我们已通过以下方式了解了如何识别问题并改进模型:
- 更好地评估模型所出现的错误类型。
- 重新平衡数据或改变模型的评估方式。
- 更改模型体系结构。
- 使用超参数。
在处理复杂数据时,机器学习专家通常将大部分时间用于修改模型体系结构和使用超参数来改进模型。 我们已经了解错误的设置对模型性能产生的影响。 决定这种情况的一个主要因素是相关数据集的大小。 通常,如果数据集较小,调优体系结构和超参数可以对模型进行相当大的改进。 对于大型数据集,这些方法仍然可以提升模型的性能,只是幅度不大。