如何使用模型

已完成

我们来复习一下这些部分如何组合在一起来训练模型的。

训练模型与使用模型

将训练模型和使用模型区分开来是至关重要的。

使用模型意味着提供输入并接收估计或预测。 我们在训练模型以及我们或客户在现实世界中使用模型时,均执行此流程。 使用模型所花的时间通常不到几秒钟。

机器学习模型的关系图,其中显示了数据进入模型,然后移动到估计。

相较而言,训练模型是改进模型性能的过程。 训练要求按特定循环使用模型、目标函数和优化程序。 训练可能需要几分钟或几天的时间才能完成。 通常,我们仅训练一次模型。 训练模型后,我们可以随心所欲地使用它,无需进行进一步更改。

最终训练的关系图,展示了机器学习模型生命周期。

例如,在我们的雪崩救援犬商店应用场景中,我们想使用公共数据集训练一个模型。 该数据集可更改模型,使其能够根据狗背带的大小预测狗散步靴的大小。 训练模型后,我们会在线商店中使用该模型,以确保客户购买的狗靴适合他们的狗。

用于使用的数据、用于训练的数据

回想一下,数据集是有关对象或事物的信息的集合。 例如,数据集可能包含有关狗的信息:

狗 ID 靴子尺寸 套具尺寸 狗的毛色 品种
0 27 12 Brown 圣伯纳犬
1 26 11 黑色 Labrador
2 25 10 White Labrador
3 29 14 黑色 黑色牧羊犬

使用模型时,我们只需要模型接受为输入的数据列。 这些列称为特征。 在我们的场景中,如果我们的模型接受背带尺寸并估算靴子尺寸,那么特征就是我们的背带尺寸。

在训练期间,目标函数通常需要了解模型的输出和正确答案。 这些值称为标签。 在我们的场景中,如果我们的模型预测靴子尺寸,那么靴子尺寸就是我们的标签。

所以要使用模型,我们只需要特征即可,而在训练期间,我们通常需要特征和标签。 在我们的场景中,在训练期间,我们需要套具尺寸这一特征和靴子尺寸这一标签。 当我们在网站中使用模型时,我们只需要知道背带尺寸这一特征 - 模型随后将估算靴子尺寸供我们使用。

我完成了模型训练。 下一步?

模型在完成训练后,你可以自行将其保存到文件中。 我们不再需要原始数据、目标函数或模型优化程序了。 当我们想要使用模型时,我们可以从磁盘加载它,为它提供新数据,然后获取预测结果。

在下一练习中,我们将练习保存模型、从磁盘加载模型,以及像在现实世界中一样使用它。 为了完成我们的在线商店场景,我们还将练习使用模型的输出在客户要购买的狗靴尺寸疑似有误的情况下提醒他们。