机器学习分数

重要

对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习

从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。

ML 工作室(经典)文档即将停用,将来可能不会更新。

本部分列出了机器学习 Studio 中提供的模块 (经典) 用于评分

注意

适用于:仅限机器学习 Studio (经典)

可在 Azure 机器学习设计器中获取类似的拖放模块。

评分也称为 "预测",它是在给定一些新的输入数据的情况下,基于训练的机器学习模型生成值的过程。 所创建的值或分数可以表示未来值的预测,但也可能表示可能的类别或结果。 分数的含义取决于您提供的数据类型以及您创建的模型的类型。

在机器学习 Studio 中创建和使用模型 (经典)

机器学习的典型工作流包括以下阶段:

  • 选择合适的算法,并设置初始选项。
  • 对兼容数据定型模型。
  • 基于模型中的模式使用新数据创建预测。
  • 评估模型,确定预测是否准确、有多少错误,以及是否有任何过度拟合。

机器学习 Studio (经典) 支持用于机器学习的灵活、可自定义的框架。 此过程中的每个任务都是通过特定类型的模块执行的,可以修改、添加或删除该模块,而不会破坏其余的实验。

本节中的模块包含用于计分的工具。 在机器学习的这一阶段,您将定型模型应用于新数据,以生成预测。 您可以将这些预测发送到使用机器学习结果的应用程序,或使用计分结果来评估模型的准确性和有用性。

有关评分的详细信息

在机器学习中,评分广泛用于表示生成新值的过程,并给定一个模型和一些新的输入。 使用通用术语 "评分",而不是 "预测",因为评分过程可以生成如此多种不同类型的值:

  • 推荐项和相似性分数的列表。
  • 数值,适用于时序模型和回归模型。
  • 一个概率值,指示新输入属于某个现有类别的概率。
  • 新项最相似的类别或群集的名称。
  • 分类模型的预测类或结果。

注意

您可能还听说过用来表示作为数据分析结果分配的权重或值的字 分数 。 但是,在机器学习 Studio (经典) ,计分通常表示从新数据生成预测值的过程。

当你在试验中添加其中的一个模块时,必须附加一个已训练的机器学习模型和一些新的数据。 运行试验或所选模块时,计分模块会引入新数据,根据模型计算评分,并返回表中的分数。

用于计分的数据

作为输入提供的新数据通常需要具有用于定型模型的相同列,而不是标签或结果列。

在训练模型时,通常会排除作为标识符使用的列,因此,在对模型进行评分时,这些列应被排除。 不过,以后使用 " 添加列 " 模块,可以轻松地将诸如主键这样的标识符与计分数据集重新组合在一起。 此模块的工作方式无需指定联接键,只要数据集的大小未发生更改。

对数据集执行评分之前,请始终检查缺失值和 null 值。 当用作计分输入的数据缺少值时,将使用缺失值作为输入。 由于将传播 null,因此结果通常为缺少值。

计分模块列表

机器学习 Studio (经典) 提供了许多不同的计分模块。 根据所使用的模型类型或要执行的计分任务的类型,选择一种:

  • 应用转换:将明确指定的数据转换应用到数据集。

    使用此模块可将已保存的进程应用于一组数据。

  • 将数据分配到群集:使用现有的定型聚类分析模型将数据分配给群集。

    如果要基于现有 K 平均值聚类分析模型对新数据进行分类,请使用此模块。

    此模块将替换 (弃用) 模块的分配到群集,该模块已被弃用,但仍可在现有试验中使用。

  • 评分 Matchbox 推荐器:使用 Matchbox 推荐器为数据集评分预测。

    如果要生成建议、查找相关项目或用户,或预测分级,请使用此模块。

  • 评分模型:对定型分类或回归模型的预测进行评分。

    此模块适用于所有其他回归和分类模型,以及一些异常情况检测模型。

  • 为 Vowpal Wabbit 提供了特殊计分模块。 请参阅文本分析
  • 通过使用 OpenCV 库,可以对预先训练模型上的特殊类图像进行评分。
  • 时序异常情况检测模块会生成表示趋势的潜在偏差的分数。

示例

Azure AI 库中的这些示例演示了从基本到高级方案评分的过程:

以下文章提供了有关如何使用机器学习模型评分的真实示例:

另请参阅