机器学习分数
重要
对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。
ML 工作室(经典)文档即将停用,将来可能不会更新。
本部分列出了机器学习 Studio 中提供的模块 (经典) 用于评分。
评分也称为 "预测",它是在给定一些新的输入数据的情况下,基于训练的机器学习模型生成值的过程。 所创建的值或分数可以表示未来值的预测,但也可能表示可能的类别或结果。 分数的含义取决于您提供的数据类型以及您创建的模型的类型。
在机器学习 Studio 中创建和使用模型 (经典)
机器学习的典型工作流包括以下阶段:
- 选择合适的算法,并设置初始选项。
- 对兼容数据定型模型。
- 基于模型中的模式使用新数据创建预测。
- 评估模型,确定预测是否准确、有多少错误,以及是否有任何过度拟合。
机器学习 Studio (经典) 支持用于机器学习的灵活、可自定义的框架。 此过程中的每个任务都是通过特定类型的模块执行的,可以修改、添加或删除该模块,而不会破坏其余的实验。
本节中的模块包含用于计分的工具。 在机器学习的这一阶段,您将定型模型应用于新数据,以生成预测。 您可以将这些预测发送到使用机器学习结果的应用程序,或使用计分结果来评估模型的准确性和有用性。
有关评分的详细信息
在机器学习中,评分广泛用于表示生成新值的过程,并给定一个模型和一些新的输入。 使用通用术语 "评分",而不是 "预测",因为评分过程可以生成如此多种不同类型的值:
- 推荐项和相似性分数的列表。
- 数值,适用于时序模型和回归模型。
- 一个概率值,指示新输入属于某个现有类别的概率。
- 新项最相似的类别或群集的名称。
- 分类模型的预测类或结果。
注意
您可能还听说过用来表示作为数据分析结果分配的权重或值的字 分数 。 但是,在机器学习 Studio (经典) ,计分通常表示从新数据生成预测值的过程。
当你在试验中添加其中的一个模块时,必须附加一个已训练的机器学习模型和一些新的数据。 运行试验或所选模块时,计分模块会引入新数据,根据模型计算评分,并返回表中的分数。
用于计分的数据
作为输入提供的新数据通常需要具有用于定型模型的相同列,而不是标签或结果列。
在训练模型时,通常会排除作为标识符使用的列,因此,在对模型进行评分时,这些列应被排除。 不过,以后使用 " 添加列 " 模块,可以轻松地将诸如主键这样的标识符与计分数据集重新组合在一起。 此模块的工作方式无需指定联接键,只要数据集的大小未发生更改。
对数据集执行评分之前,请始终检查缺失值和 null 值。 当用作计分输入的数据缺少值时,将使用缺失值作为输入。 由于将传播 null,因此结果通常为缺少值。
计分模块列表
机器学习 Studio (经典) 提供了许多不同的计分模块。 根据所使用的模型类型或要执行的计分任务的类型,选择一种:
应用转换:将明确指定的数据转换应用到数据集。
使用此模块可将已保存的进程应用于一组数据。
将数据分配到群集:使用现有的定型聚类分析模型将数据分配给群集。
如果要基于现有 K 平均值聚类分析模型对新数据进行分类,请使用此模块。
此模块将替换 (弃用) 模块的分配到群集,该模块已被弃用,但仍可在现有试验中使用。
评分 Matchbox 推荐器:使用 Matchbox 推荐器为数据集评分预测。
如果要生成建议、查找相关项目或用户,或预测分级,请使用此模块。
评分模型:对定型分类或回归模型的预测进行评分。
此模块适用于所有其他回归和分类模型,以及一些异常情况检测模型。
相关任务
示例
Azure AI 库中的这些示例演示了从基本到高级方案评分的过程:
直接营销的二元分类:演示用于评分的基本工作流,其中预测值是客户对市场营销活动的响应。
预测书籍评论:对文本数据进行评分。 使用逻辑回归模型。
带计数的 Learning:演示如何使用基于计数的特征化来进行预测。
逻辑应用和机器学习的非代码批处理评分:说明了通过 Azure 应用服务的逻辑应用功能自动进行定型和评分的端到端过程。
以下文章提供了有关如何使用机器学习模型评分的真实示例: