迁移学习
在生活中,如果你已经具备了类似的、可迁移的技能的专业知识,学习新技能往往会更加容易。 例如,如果某人已经学会了驾驶汽车,那么教他们如何驾驶公共汽车可能会更加容易。 司机可以在驾驶汽车所学知识的基础上提高驾驶技能,并把这些技能应用到驾驶公共汽车上。
同样的原则也适用于通过一种名为“迁移学习”的技术来训练深度学习模型。
迁移学习的工作原理
用于图像分类的卷积神经网络 (CNN) 通常由多个层组成,这些层提取特征,然后由最后的完全连接层来根据这些特征对图像进行分类。
从概念上讲,此神经网络包含两组不同的层:
- 基础模型中的一组层,用于执行特征提取。
- 一个完全连接层,它获取提取的特征并将其用于类预测。
特征提取层应用卷积筛选器和池化来强调图像中可用于区分它们的边、角和其他图形,理论上应该适用于与网络的输入层具有相同尺寸的任何图像集。 预测层将特征映射到一组输出,这些输出表示要用于对图像进行分类的每个类标签的概率。
通过将网络分割为这些类型的层,我们可以从已经过训练的模型中获取特征,并附加一个或多个层,以使用提取的特征来预测图像的适当类标签。 利用此方法,你可以为特征提取层保留预先训练的权重,这意味着你只需训练添加的预测层。
建立用于图像分类的卷积神经网络体系结构有很多种,你可以将其用作迁移学习的基础模型,以便在其他人已经完成的工作的基础上轻松创建有效的图像分类模型。