评分 Vowpal Wabbit 版本7-10 型号
重要
对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。
ML 工作室(经典)文档即将停用,将来可能不会更新。
从命令行界面使用 Vowpal Wabbit 机器学习系统为数据评分
类别:文本分析
模块概述
本文介绍如何使用机器学习 Studio 中的评分 Vowpal Wabbit 版本 7-10模块 (经典) ,使用现有的 Vowpal Wabbit 模型为一组输入数据生成评分。
此模块使用版本7-10 的 Vowpal Wabbit 框架。 使用此模块可以使用以7-10 格式保存的定型模型对数据进行评分。
如果你有使用早期版本创建的现有模型,请使用以下模块:
对于 Vowpal Wabbit 的最新版本,请使用:
如何配置评分 Vowpal Wabbit 版本7-10 型号
向试验中添加 评分 Vowpal Wabbit 版本 7-10 模块。
添加经过训练的 Vowpal Wabbit 模型,并将其连接到左侧输入端口。 您可以使用在同一试验中创建的训练模型,或在 Studio 的 "已 定型模型 " 组中查找已保存的模型 (经典) 的左侧导航窗格。
限制
模型必须在机器学习 Studio (经典) 中可用; 你不能直接从 Azure 存储中加载模型。
仅支持 Vowpal Wabbit 7-10 模型;不能连接使用其他算法训练的已保存的模型,也不能使用使用早期版本或更高版本训练的模型。
在 VW 参数文本框中,键入一组有效的 Vowpal Wabbit 可执行文件命令行参数。
有关机器学习中支持和不支持哪些 Vowpal Wabbit 参数的信息,请参阅技术说明部分。单击 " 指定数据类型",然后从列表中选择一个支持的数据类型。
评分要求 VW 兼容数据的单个列。
如果已使用 SVMLight 或 VW 格式创建的现有文件,则可以使用以下格式之一将其作为新数据集加载到 Azure ML 工作区:不带标头的通用 CSV,TSV 无标头。
VW选项需要一个标签,但不会将其用于评分。
添加 " 导入数据 " 模块并将其连接到 计分 Vowpal Wabbit 版本 7-10的右侧输入端口。 配置 导入数据 以访问输入数据。
必须事先使用所支持的格式之一来准备计分输入数据并将其存储在 Azure blob 存储中。
如果要将标签与分数一起输出,请选择选项“包括含标签的额外列”。
通常,在处理文本数据时,Vowpal Wabbit 不需要标签,而只返回每个数据行的分数。
如果希望在满足以下条件的情况下重新使用以前运行的结果,请选择 " 使用缓存的结果" 选项:
以前的运行中存在有效的缓存。
自上一次运行后,模块的输入数据和参数设置未更改。
否则,每次运行实验时都会重复导入过程。
运行试验。
结果
在训练完成后:
- 若要直观显示结果,请右键单击 评分 Vowpal Wabbit 版本 7-10 模块的输出。
输出会显示一个标准化为 0 到 1 范围内数字的预测分数。
示例
有关如何在机器学习中使用 Vowpal Wabbit 的示例,请参阅 Azure AI 库:
-
此实验演示了 VW 模型的数据准备、定型和操作化。
以下视频提供了 Vowpal Wabbit 的培训和评分过程的演练:
技术说明
本部分包含实现详情、使用技巧和常见问题解答。
参数
Vowpal Wabbit 具有许多用于选择和优化算法的命令行选项。 这里不对这些选项做全面介绍;建议查看 Vowpal Wabbit wiki 页面。
机器学习 Studio (经典) 不支持以下参数。
https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments 中指定的输入/输出选项
模块已自动配置这些属性。
此外,不允许任何生成多个输出或接受多个输入的选项。 其中包括
--cbt
、--lda
和--wap
。仅支持监督式学习算法。 无法使用这些选项:
–active
、--rank
、--search
等。
上述参数以外的其他所有参数都可以使用。
预期输入
名称 | 类型 | 说明 |
---|---|---|
已训练模型 | ILearner 接口 | 训练的学习器 |
数据集 | 数据表 | 要评分的数据集 |
模块参数
名称 | 范围 | 类型 | 默认 | 说明 |
---|---|---|---|---|
VW 参数 | 任意 | 字符串 | 无 | 键入 Vowpal Wabbit 参数。 不支持以下参数: - -i - -p 或 - -t |
包含带有标签的附加列 | True/False | Boolean | false | 指定压缩文件是否应在预测中包含标签 |
指定数据类型 | VW SVMLight |
数据类型 | VW | 指示文件格式是 SVMLight 还是 Vowpal Wabbit |
Outputs
名称 | 类型 | 说明 |
---|---|---|
结果数据集 | 数据表 | 包含预测结果的数据集 |
例外
异常 | 描述 |
---|---|
错误 0001 | 如果找不到数据集的一个或多个指定列,将出现异常。 |
错误 0003 | 如果一个或多个输入为 NULL 或为空,将出现异常。 |
错误 0004 | 如果参数小于或等于特定值,将出现异常。 |
错误 0017 | 如果一个或多个指定列具有当前模块不支持的类型,则会发生异常。 |
有关特定于 Studio (经典) 模块的错误列表,请参阅机器学习错误代码。
有关 API 异常的列表,请参阅机器学习 REST API 错误代码。
另请参阅
文本分析
特征哈希
命名实体识别
对 Vowpal Wabbit 7-4 模型评分
训练 Vowpal Wabbit 7-4 模型
训练 Vowpal Wabbit 7-10 模型
A-Z 模块列表