介绍

已完成

在机器学习中,根据已知标签与训练数据中找到的特征之间的相关性,训练模型来预测新数据的未知标签。 根据所使用的算法,可能需要指定 超参数 来配置模型训练方式。

例如,逻辑回归 算法使用 正则化率 超参数来应对过度拟合;卷积神经网络(CNN)的深度学习技术使用超参数(如 学习速率 来控制训练期间调整权重的方式,批大小 来确定每个训练批次中包含的数据项数。

注意

机器学习是一个具有自身特定术语的学术领域。 数据科学家将训练特征中确定的值称为 参数,因此,用于配置训练行为的值需要不同的术语,但 派生自训练数据的值,因此术语 超参数

选择超参数值可能会显著影响生成的模型,因此请务必为特定数据和预测性能目标选择最佳可能值。

优化超参数

执行超参数优化导致不同模型的不同超参数值的示意图。

超参数优化 是通过使用相同算法和训练数据但不同的超参数值训练多个模型来实现的。 然后,将评估每个训练运行中生成的模型,以确定要优化的性能指标(例如,准确性),并选择性能最佳的模型。

在 Azure 机器学习中,可以通过将脚本提交为 超参数调优任务来优化超参数。 扫描作业将针对要测试的每个超参数组合运行 试用。 每个试用版都使用具有参数化超参数值的训练脚本来训练模型,并记录训练模型实现的目标性能指标。

学习目标

在本模块中,你将了解如何:

  • 定义超参数搜索空间。
  • 配置超参数采样。
  • 选择提前终止策略。
  • 运行扫描作业。