介绍
回归是一种简单、通用且非常有用的数据分析技术,俗称为“拟合趋势线”。回归标识一个或多个特征与单个标签之间的关系的强度。 它的简单性、可预测的行为、预测能力和高级别的可解释性意味着此技术可用于财务、商务、社会科学、流行病学和医学等领域。
在此模块中,我们将深入探讨回归的工作原理,了解其限制,并了解如何评估其性能。
方案:兽医诊所超限
在本模块中,我们将使用下面的示例方案来解释回归蕴含的概念。 此方案旨在提供一个示例,说明如何在分析未来数据时使用此技术。
你运营的狗狗雪崩救援慈善机构突然发生了一波疫情。 在一天的重新训练和一些社交活动之后,你训练的很多狗身体不舒服,主要症状是发烧(体温升高)。 出于对尚未出现症状的狗的担心,你的团队收集了有关已生病的前 100 条狗的基本信息。 你的工作是确定哪些品种的狗患病的风险更高,以便兽医可以主动检查它们。
学习目标
在本模块中,你将:
- 了解回归的工作原理。
- 使用新算法:线性回归、多元线性回归和多项式回归。
- 了解回归模型的优点和限制。
- 使用线性回归可视化错误和成本函数。
- 了解回归的基本评估指标。
先决条件
- 熟悉机器学习模型