此浏览器不再受支持。
请升级到 Microsoft Edge 以使用最新的功能、安全更新和技术支持。
为什么我们在训练之前要清理数据?
删除数据行会使我们的模型更加强大。
清理数据可帮助我们选择对模型性能有帮助的特征。
删除有错误的行可防止这些行误导训练过程。
哪种类型的数据最好通过独热向量进行编码?
有序数据
具有两个可能值的分类数据
具有三个或更多值的分类数据
什么是数据样本? 什么是总体?
样本是我们关注的所有可能数据。 数据集是我们手头实际拥有的数据的子集。
总体和样本都是指用于训练模型的数据。
总体是我们关注的所有可能数据。 样本是我们手头实际拥有的数据的子集。
你的模型性能不佳。 以下哪些选项对于提高性能肯定没有帮助?
添加更多示例(行)。
添加少量你认为与模型试图预测的内容相关的特征(列)。
添加大量你认为与模型试图预测的内容不相关的特征。
在检查工作前,必须回答所有问题。
此页面是否有帮助?