总结
我们完成了对分类的介绍,现在让我们重述一些关键要点。
我们看到分类与经典回归有很多共同点。 对于两者,我们都可以使用监督学习、成本函数,并使用测试和训练数据集来估计实际性能。 我们在这里专注于逻辑回归,它几乎是这两种模型的混合体,并说明了输出的阈值如何为我们提供分类标签,例如 avalanche
/no-avalanche
。
我们讨论了评估分类模型为何比使用回归模型更难一些,特别是因为所涉及的成本函数通常不直观。
我们还探讨了添加和组合特征如何显著改进模型。 重要的是,我们介绍了如何真正思考数据的含义是获得最佳结果的关键。
在此模块中,我们使用了逻辑回归。 但请记住,我们在这里介绍的大多数主题也适用于许多其他类型的分类模型。 包括尝试预测两个以上可能类别的模型。