介绍

已完成

在机器学习中,模型被训练为根据已知标签和在训练数据中发现的特征之间的相关性来预测新数据的未知标签。 根据所使用的算法,可能需要指定超参数来配置模型的训练方式。

例如,逻辑回归算法使用正则化率超参数来抵消过度拟合;用于卷积神经网络 (CNN) 的深度学习技术使用学习率等超参数来控制在训练期间如何调整权重,并使用批大小来确定每个训练批处理中包含多少个数据项。

注意

机器学习是一种有自己的特定术语的学术领域。 数据科学家将从训练特征中确定的值称为“参数”,那么就需要对用于配置训练行为、但不是从训练数据中派生的值使用不同的术语,所以就有了“超参数”一词

超参数值的选择可能会显著影响生成的模型,因此为特定数据和预测性能目标选择最优值非常重要。

优化超参数

Diagram of different hyperparameter values resulting in different models by performing hyperparameter tuning.

超参数优化是通过此方法完成的:使用相同的算法和训练数据,但使用不同的超参数值来训练多个模型。 然后,评估每次训练运行所生成的模型,以确定要优化的性能指标(例如,准确度),并选择性能最佳的模型。

在 Azure 机器学习中,可以通过提交脚本作为扫描作业来优化超参数。 扫描作业将为要测试的每个超参数组合运行试用。 每个试用都使用带有参数化超参数值的训练脚本来训练模型,并记录已训练模型实现的目标性能指标。

学习目标

在本模块中,你将了解如何:

  • 定义超参数搜索空间。
  • 配置超参数采样。
  • 选择提前终止策略。
  • 运行扫描作业。