贝叶斯线性回归
重要
对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。
ML 工作室(经典)文档即将停用,将来可能不会更新。
创建贝叶斯线性回归模型
模块概述
本文介绍如何使用机器学习 Studio (经典) 中的 " Bayesian 线性回归" 模块,定义基于 Bayesian 统计信息的回归模型。
定义了模型参数之后,必须使用标记的数据集和 训练模型 模块来训练该模型。 然后,可以使用训练后的模型进行预测。 另外,还可以将未训练的模型传递给 交叉验证模型 ,以便对标记的数据集进行交叉验证。
有关 Bayesian 回归的详细信息
在统计学中,贝叶斯回归方法通常与频率论方法相对。
贝叶斯方法使用先前概率分布形式的其他信息补充的线性回归。 以前的参数信息与可能性函数结合使用来生成参数估计值。
与此相反,以标准最小二乘法线性回归表示的频率论方法假设数据中包含足够多用于创建有意义模型的度量值。
有关此算法背后的研究的详细信息,请参阅 技术说明 部分中的链接。
如何配置 Bayesian 回归
将 Bayesian 线性回归 模块添加到试验中。 您可以在 "回归" 类别中机器学习"初始化" 下找到此模块。
正则化权重:键入要用于正则化的值。 正则化用于防止过度拟合。 此权重对应于 L2。 有关详细信息,请参阅 技术说明 部分。
允许未知的分类级别:选择此选项可为未知值创建分组。 模型只能接受定型数据中包含的值。 对于已知值,该模型可能不太准确,但对新的 (未知) 值提供更好的预测。
连接定型数据集和训练模块之一。 此模型类型没有可在参数扫描中更改的参数,因此,虽然您可以使用 优化模型超参数来训练模型,但它不能自动优化模型。
选择要建模或预测的单个数值列。
运行试验。
结果
在训练完成后:
示例
有关回归模型的示例,请参阅 Azure AI 库。
- 比较回归模型示例:对比几种不同类型的回归模型。
技术说明
以下机器学习中详细介绍了如何使用 lambda 系数:模式识别和机器学习、Christopher Bishop、springer link-Verlag、2007。
可从 Microsoft Research 网站下载 PDF 下载内容: Bayesian 回归和分类
模块参数
名称 | 范围 | 类型 | 默认 | 说明 |
---|---|---|---|---|
正则化权重 | >=double.Epsilon | Float | 1.0 | 键入要在正则化中使用的常量。 该常量表示先前的权重精度与干扰精度之比。 |
允许未知的分类级别 | 任意 | 布尔 | 是 | 如果为 true,则为每个分类列创建一个附加级别。 测试数据集中不可用于训练数据集的任何级别将映射到此附加级别。 |
Outputs
名称 | 类型 | 说明 |
---|---|---|
未训练的模型 | ILearner 接口 | 未训练的贝叶斯线性回归模型 |