什么是分类模型?
分类模型用于做出决策或将项分配到类别。 与输出连续数字(如高度或重量)的回归模块不同,分类模型输出布尔值(true
或 false
)或分类决策(例如 apple
、banana
或 cherry
)。
有许多类型的分类模型。 有些与经典回归模型类似,而另一些则基本不同。 最初要学习的最佳模型之一称为逻辑回归。
什么是逻辑回归?
逻辑回归是一种分类模型,其工作方式类似于线性回归。 逻辑回归与线性回归之间的区别在于曲线的形状。 简单线性回归拟合数据的直线,而逻辑回归模型拟合 S 形曲线:
逻辑回归比线性回归更适用于估计布尔结果,因为逻辑曲线始终生成 0 (false) 和 1 (true) 的值。 这两个值之间的任何值都可以视为概率。
例如,假设我们尝试预测今天是否会发生雪崩。 如果逻辑回归模型给出的值为 0.3,则它估计有 30% 的概率会发生雪崩。
将输出转换为类别
由于逻辑回归提供给我们这些概率,而不是简单的 true/false 值,因此我们需要执行额外的步骤将结果转换为类别。 进行此转换的最简单方法就是应用阈值。 例如,在下图中,我们的阈值设置为 0.5。 此阈值意味着,任何低于 0.5 的 y 值都转换为 false(左下框),任何高于 0.5 的值都转换为 true(右上框)。
查看该图,可以看到,当特征低于 5 时,概率将小于 0.5,因此将转换为 false。 5 以上的特征值提供 0.5 以上的概率,因此将转换为 true。
值得注意的是,逻辑回归不必仅限于 true/false 结果,它还可以用于存在三个或更多潜在结果(例如 rain
、snow
或 sun
)的情况。 此类型的结果需要一种稍微复杂的设置,称为多项式逻辑回归。虽然我们不会在接下来的几个练习中练习多项式逻辑回归,但在你需要进行非二进制预测的情况下,这一点值得考虑。
还需注意的是,逻辑回归可以使用多个输入特征:稍后将对这种情况进行详细介绍。