什么是机器学习模型?

已完成

模型是机器学习的核心组件,是我们最终要尝试构建的内容。 模型可以从照片中估算出一个人的年龄、预测你可能希望在社交媒体上看到的内容,或者确定机械臂应该移动到的位置。 在我们的场景中,我们想构建一个可以根据狗的套具尺寸来估计最合适的靴子尺寸的模型。

可以通过多种方式构建模型。 例如,模拟飞机飞行原理的传统模型是人们利用物理学和工程学知识构建而成。 机器学习模型比较特殊 - 机器学习模型由数据塑造而成,而不是由人来对模型进行编辑使它们能很好地工作。 机器学习模型从经验中学习。

如何看待模型

可以将模型视为一种接受数据作为输入并生成输出的函数。 更具体地说,模型使用输入数据来估计其他内容。 例如,在我们的方案中,我们要构建一个给定套具大小后对靴子大小进行估算的模型:

显示不带参数的模型的关系图。

套具尺寸和狗靴尺寸是数据;它们不是模型的一部分。 套具尺寸是我们输入的数据,狗靴尺寸是输出数据。

模型通常是简单的代码

通常情况下,模型与你已经熟悉的简单函数没有什么意义上的区别。 与其他代码一样,它们包含逻辑和参数。 例如,逻辑可能是将套具尺寸乘以 parameter_1:

显示带有一个未指定参数的模型的关系图。

如果此处的 parameter_1 为 2.5,我们的模型会将套具尺寸乘以 2.5 并返回结果:

显示带有唯一参数 2.5 的模型的关系图。

选择模型

模型有很多类型,一些是简单模型,一些是复杂模型。

与所有代码一样,较简单的模型通常最可靠且易于理解,而复杂的模型则可能会有令人印象深刻的非凡表现。 应选择哪种模型具体取决于具体目标。 例如,医疗科学家通常使用相对简单的模型,因为它们可靠且直观。 相比之下,基于 AI 的机器人通常依赖复杂的模型。

机器学习的第一步是选择想要使用的模型类型。 因此,我们要根据模型的内部逻辑来选择模型。 例如,我们可以选择一个双参数模型,根据套具尺寸来估算狗靴尺寸:

显示具有两个未指定参数的模型的关系图。

请注意,我们是根据模型在逻辑上的工作方式而不是根据其参数值来选择模型的。 事实上,此时参数尚未设置为任何特定值。

参数是在训练期间发现的

人工设计器不选择参数值。 相反,参数值设置为初始猜测值,然后在称为“训练”的自动学习过程中进行调整。

鉴于我们选择了双参数模型,因此我们首先为参数提供随机猜测:

显示具有参数 0.2 和 1.2 的模型的关系图。

这些随机参数意味着模型并不擅长估算靴子尺寸,因此我们将进行训练。 在训练期间,这些参数会自动更改为两个新值,从而提供更好的结果:

显示具有参数 1.5 和 4 的模型的关系图。

在你的整个学习旅途中,我们将逐步解释此过程的工作原理。