介绍

已完成

分类是机器学习的一种形式,可在其中训练模型来预测某个项属于哪个类别。 例如,健康诊所可能会使用患者的身高、体重、血压和血糖水平等诊断数据来预测该患者是否患有糖尿病。

预测糖尿病的医学诊断特征插图。

分类数据具有类,而不是数值。 某些类型的数据可以是数字的,也可以是分类的。 例如,比赛时间可以是以秒为单位的数字时间,也可以是分类的类(快、中等或慢)。 其他类型的数据只能是分类的,例如一种形状 -“圆形”、“三角形”或“方形”。

先决条件

  • 基本数学知识
  • 在 Python 中有一定的编程经验

学习目标

本模块介绍了以下内容:

  • 何时使用分类
  • 如何使用 Scikit-Learn 框架来训练和评估分类模型