机器学习 Studio (经典) 的 A-Z 列表
重要
对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。
ML 工作室(经典)文档即将停用,将来可能不会更新。
提示
建议当前使用或评估机器学习工作室(经典版)的客户尝试使用 Azure 机器学习设计器,该设计器提供了拖放式 ML 模块以及可伸缩性、版本控制和企业安全性。
这些模块涵盖了机器学习任务所需的各种特性和功能:
- 数据转换函数
- 数据转换函数
- 用于执行 R 或 Python 脚本的模块
- 算法,包括:
- 决策树
- 决策林
- 群集功能
- 时序
- 建议模型
- 异常检测
查找模块:
按字母顺序排列的模块表
模块名称 | 说明 |
---|---|
添加列 | 将一组列从一个数据集添加到另一个数据集。 |
添加行 | 将一组行从输入数据集追加到另一个数据集的末尾。 |
应用筛选器 | 将筛选器应用于数据集的指定列。 |
应用数学运算 | 将数学运算应用于列值。 |
应用 SQL 转换 | 对输入数据集运行 SQLite 查询以转换数据。 |
应用转换 | 将指定良好的数据转换应用于数据集。 |
将数据分配到群集 | 使用现有已训练的聚类分析模型将数据分配给群集。 |
贝叶斯线性回归 | 创建贝叶斯线性回归模型。 |
提升决策树回归 | 使用提升决策树算法创建回归模型。 |
构建计数转换 | 创建用于生成功能的计数。 |
清理缺失数据 | 指定如何处理数据集中缺少的值。 |
剪切值 | 检测离群值,然后剪辑或替换其值。 |
计算基础统计 | 计算所选数据集列的指定摘要统计信息。 |
检测语言 | 检测输入文件中每行的语言。 |
计算线性相关性 | 计算数据集中列值之间的线性关联。 |
转换为 ARFF | 将数据输入转换为 Weka 工具集使用的属性关系文件格式。 |
转换为 CSV | 将数据输入转换为逗号分隔值格式。 |
转换为数据集 | 将数据输入转换为数据输入所使用的内部数据集机器学习。 |
转换为指示器值 | 将列中的分类值转换为指示器值。 |
转换为 SVMLight | 将数据输入转换为 SVMlight 框架使用的格式。 |
转换为 TSV | 将数据输入转换为制表符分隔的格式。 |
创建 R 模型 | 使用自定义资源创建 R 模型。 |
交叉验证模型 | 通过将数据分区,交叉验证分类或回归模型的参数估计值。 |
决策林回归 | 使用决策林算法创建回归模型。 |
检测语言 | 检测输入文件中每行的语言。 |
编辑元数据 | 编辑与数据集中的列关联的元数据。 |
手动输入数据 | 通过键入值启用输入和编辑小型数据集。 |
评估模型 | 使用标准指标评估评分分类或回归模型。 |
评估概率函数 | 适合数据集的指定概率分布函数。 |
评估推荐器 | 评估推荐器模型预测的准确性。 |
执行 Python 脚本 | 从试验中执行 Python 机器学习脚本。 |
执行 R 脚本 | 从试验中执行 R 机器学习脚本。 |
导出计数表 | 从计数转换导出计数。 |
导出数据 | 将数据集写入 Web URL 或 Azure 中各种基于云的存储形式,例如表、blob 和Azure SQL数据库。 此模块以前名为 Writer。 |
从文本中提取关键短语 | 从文本列中提取关键字和短语。 |
从文本中提取 N 元语法特征 | 创建 N 语法字典功能,然后对它们执行功能选择。 |
快速林分位回归 | 创建分位回归模型。 |
特征哈希 | 使用 Vowpal Wabbit 库将文本数据转换为整数编码的功能。 |
基于筛选器的特征选择 | 标识数据集中具有最高预测能力的功能。 |
FIR 过滤器 | 创建用于信号处理的有限脉冲响应筛选器。 |
费舍尔线性判别分析 | 标识可将数据最好地分组到单独的类中的特征变量的线性组合。 |
组分类值 | 将来自多个类别的数据分组到一个新类别中。 |
将数据分组到箱中 | 将数值数据放入储箱。 |
IIR 过滤器 | 为信号处理创建无限脉冲响应筛选器。 |
导入计数表 | 从现有计数表中导入计数。 |
导入数据 | 从 web 上的外部源或 Azure 中的各种形式的基于云的存储(如表、blob、SQL 数据库和 Azure Cosmos DB)加载数据。 如果网关已配置,则可以从本地 SQL Server 数据库加载数据。 此模块以前名为 " 读取器"。 |
导入图像 | 将 Azure Blob 存储中的图像加载到数据集。 |
联接数据 | 联接两个数据集。 |
K 均值聚类分析 | 配置和初始化 K 平均值聚类分析模型。 |
隐性 Dirichlet 分配 | 使用用于潜在 Dirichlet 分配 (LDA) 的 Vowpal Wabbit 库来执行主题建模。 |
线性回归 | 创建线性回归模型。 |
加载已训练的模型 | 获取可用于在实验中评分的定型模型。 |
中间值过滤器 | 创建用于平滑数据以进行趋势分析的中间筛选器。 |
合并计数转换 | 合并两组计数表。 |
修改计数表参数 | 从计数表中生成一个精简的基于计数的特征集。 |
移动平均线过滤器 | 创建用于平滑数据以进行趋势分析的移动平均线筛选器。 |
多类决策林 | 使用决策林算法创建多类分类模型。 |
多类决策林 | 使用决策蛙鸣算法创建多类分类模型。 |
多类逻辑回归 | 创建多类逻辑回归分类模型。 |
多类神经网络 | 使用神经网络算法创建多类分类模型。 |
命名实体识别 | 识别文本列中的命名实体。 |
神经网络回归 | 使用神经网络算法创建回归模型。 |
规范化数据 | 重新缩放数值数据,以将数据集值限制为标准范围。 |
单类支持向量机 | 为异常检测创建单类支持向量机模型。 |
“一对多”多类分类 | 从二元分类模型的系综创建多类分类模型。 |
顺序回归 | 创建顺序回归模型。 |
分区和采样 | 基于采样创建数据集的多个分区。 |
排列特征重要性 | 计算定型模型和测试数据集中的特征变量的排列特征重要性分数。 |
基于 PCA 的异常情况检测 | 使用主体组件分析 (PCA) 创建异常情况检测模型。 |
泊松回归 | 创建一个回归模型,该模型假定数据具有泊松分布。 |
预处理文本 | 对文本执行清理操作。 |
预先训练的级联图像分类 | 使用 OpenCV 库为正面面部创建预先训练图像分类模型。 |
主体组件分析 | 计算一组功能,这些功能缩减了维数以实现更高效的学习。 |
删除重复的行 | 从数据集中删除重复行。 |
替换离散值 | 将一个列中的离散值替换为基于另一个列的数字值。 |
评分 Matchbox 推荐器 | 通过使用 Matchbox 推荐器来对数据集进行评分。 |
评分模型 | 对定型分类或回归模型的预测进行评分。 |
对 Vowpal Wabbit 7-4 模型评分 | 使用 Vowpal Wabbit 机器学习系统为数据评分。 需要使用 Vowpal Wabbit 版本7-4 和7-6 生成的定型模型。 |
对 Vowpal Wabbit 7-10 模型评分 | 使用 Vowpal Wabbit 机器学习系统为数据评分。 需要使用 Vowpal Wabbit 版本7-10 生成的定型模型。 |
对 Vowpal Wabbit 8 模型评分 | 使用命令行界面中的 Vowpal Wabbit 机器学习系统对数据进行评分。 需要使用 Vowpal Wabbit 版本8生成定型模型。 |
在数据集中选择列 | 选择要包含在操作中的数据集或从中排除的列。 |
SMOTE | 使用综合少数过度抽样,增加数据集中的低级示例数。 |
拆分数据 | 将数据集的行分区为两个不同的集。 |
汇总数据 | 为数据集中的列生成基本的描述性统计信息报表。 |
整理群集 | 对聚类分析模型执行参数扫描,以确定最佳参数设置。 |
使用 T-Test 测试假设 | 使用 t-test 比较两个数据集中的含义。 |
阈值过滤器 | 创建限制值的阈值筛选器。 |
Time Series Anomaly Detection (时序异常情况检测) | 了解时序数据的趋势,然后使用趋势来检测异常。 |
训练异常情况检测模型 | 训练异常检测器模型,然后标记训练集的数据。 |
训练群集模型 | 训练聚类分析模型,然后将训练集中的数据分配给群集。 |
训练 Matchbox 推荐器 | 使用 Matchbox 算法训练贝叶斯推荐器。 |
训练模型 | 以监督方式训练分类或回归模型。 |
训练 Vowpal Wabbit 7-4 模型 | 从 Vowpal Wabbit 机器学习系统训练模型。 此模块与 Vowpal Wabbit 版本 7-4 和 7-6 兼容。 |
训练 Vowpal Wabbit 7-10 模型 | 从 Vowpal Wabbit 机器学习系统训练模型。 此模块适用于 Vowpal Wabbit 版本 7-10。 |
训练 Vowpal Wabbit 8 模型 | 使用 Vowpal Wabbit 机器学习系统版本 8 训练模型。 此模块适用于 Vowpal Wabbit 版本 8。 |
优化模型超参数 | 对回归或分类模型执行参数扫描,以确定最佳参数设置。 |
双类平均感知器 | 创建平均感知器二元分类模型。 |
双类贝叶斯点机 | 创建贝叶斯点计算机二元分类模型。 |
双类提升决策树 | 使用提升决策树算法创建二元分类器。 |
双类决策林 | 使用决策林算法创建双类分类模型。 |
双类决策林 | 使用决策算法创建双类分类模型。 |
双类局部深层支持向量机 | 使用本地深层支持向量机算法创建二元分类模型。 |
双类逻辑回归 | 创建双类逻辑回归模型。 |
双类神经网络 | 使用神经网络算法创建二元分类器。 |
双类支持向量机 | 使用支持向量机算法创建二元分类模型。 |
解压缩已压缩的数据集 | 从用户存储中的.zip包解压缩数据集。 |
用户定义的筛选器 | 创建自定义有限或无限脉冲响应筛选器。 |