评分 Vowpal Wabbit 版本7-4 型号

重要

对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习

从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。

ML 工作室(经典)文档即将停用,将来可能不会更新。

从命令行界面使用 Vowpal Wabbit 机器学习系统为数据评分

类别:文本分析

注意

适用于:仅限机器学习 Studio (经典)

可在 Azure 机器学习设计器中获取类似的拖放模块。

模块概述

本文介绍如何使用机器学习 Studio 中的评分 Vowpal Wabbit 版本 7-4模块 (经典) ,使用现有的定型 Vowpal Wabbit 模型为一组输入数据生成评分。

提供此模块是为了与 Vowpal Wabbit framework 版本7-4 兼容。 仅当需要使用以7-4 格式保存的定型模型对数据进行评分时,才使用此模块。

若要创建新的 VW 模型,建议使用最新版本:

如何配置评分 Vowpal Wabbit 版本7-4 型号

  1. 向试验中添加 评分 Vowpal Wabbit 版本 7-4 模块。

  2. 添加经过训练的 Vowpal Wabbit 模型,并将其连接到左侧输入端口。 您可以使用在同一试验中创建的训练模型,或在 Studio 的 "已 定型模型 " 组中查找已保存的模型 (经典) 的左侧导航窗格。

    限制

    模型必须在机器学习 Studio (经典) 中可用; 你不能直接从 Azure 存储中加载模型。

    仅支持 Vowpal Wabbit 7-4 模型;不能连接使用其他算法训练的已保存的模型,也不能使用通过更高版本训练的模型。

  3. 在 VW 参数文本框中,键入一组有效的 Vowpal Wabbit 可执行文件命令行参数。

    有关机器学习中支持哪些 Vowpal Wabbit 参数的信息,请参阅技术说明部分。

  4. 单击 " 指定数据类型",然后从列表中选择一个支持的数据类型。

    评分要求 VW 兼容数据的单个列。

    如果已使用 SVMLight 或 VW 格式创建的现有文件,则可以使用以下格式之一将其作为新数据集加载到 Azure ML 工作区:不带标头的通用 CSV,TSV 无标头。

    VW选项需要一个标签,但不会将其用于评分。

  5. 添加 " 导入数据 " 模块并将其连接到 计分 Vowpal Wabbit 版本 7-4的右侧输入端口。 配置 " 导入数据 " 模块以访问输入数据。

    必须事先使用所支持的格式之一来准备计分输入数据并将其存储在 Azure blob 存储中。

  6. 如果要将标签与分数一起输出,请选择选项“包括含标签的额外列”。

    通常,在处理文本数据时,Vowpal Wabbit 不需要标签,并且仅返回每行数据的分数。

  7. 如果希望在满足以下条件的情况下重新使用以前运行的结果,请选择 " 使用缓存的结果" 选项:

    • 以前的运行中存在有效的缓存。

    • 自上一次运行后,模块的输入数据和参数设置未更改。

    否则,每次运行实验时都会重复导入过程。

  8. 运行试验。

结果

在训练完成后:

输出会显示一个标准化为 0 到 1 范围内数字的预测分数。

示例

有关如何在机器学习中使用 Vowpal Wabbit 的示例,请参阅 Azure AI 库

以下视频提供了 Vowpal Wabbit 的培训和评分过程的演练:

技术说明

本部分包含实现详情、使用技巧和常见问题解答。

支持的和不支持的参数

Vowpal Wabbit 具有许多用于选择和优化算法的命令行选项。 这里不对这些选项做全面介绍;建议查看 Vowpal Wabbit wiki 页面

机器学习 Studio (经典) 不支持以下参数。

上述参数以外的其他所有参数都可以使用。

预期输入

名称 类型 说明
已训练模型 ILearner 接口 训练的学习器
数据集 数据表 要评分的数据集

模块参数

名称 范围 类型 默认 说明
VW 参数 任意 字符串 键入 Vowpal Wabbit 参数。

不支持以下参数:

- -i
- -p
- -t
包含带有标签的附加列 任意 布尔 false 指定压缩文件是否应在预测中包含标签
指定数据类型 VW

SVMLight
数据类型 VW 指示文件格式是 SVMLight 还是 Vowpal Wabbit

Outputs

名称 类型 说明
结果数据集 数据表 包含预测结果的数据集

例外

异常 描述
错误 0001 如果找不到数据集的一个或多个指定列,将出现异常。
错误 0003 如果一个或多个输入为 NULL 或为空,将出现异常。
错误 0004 如果参数小于或等于特定值,将出现异常。
错误 0017 如果一个或多个指定列具有当前模块不支持的类型,则会发生异常。

有关特定于 Studio (经典) 模块的错误列表,请参阅机器学习错误代码

有关 API 异常的列表,请参阅机器学习 REST API 错误代码

另请参阅

文本分析
特征哈希
命名实体识别
Vowpal Wabbit 评分
训练 Vowpal Wabbit 7-4 模型
训练 Vowpal Wabbit 7-10 模型
A-Z 模块列表