机器学习 Studio (经典) 的 A-Z 列表

重要

对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习

从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。

ML 工作室(经典)文档即将停用,将来可能不会更新。

提示

建议当前使用或评估机器学习工作室(经典版)的客户尝试使用 Azure 机器学习设计器,该设计器提供了拖放式 ML 模块以及可伸缩性、版本控制和企业安全性。

这些模块涵盖了机器学习任务所需的各种特性和功能:

  • 数据转换函数
  • 数据转换函数
  • 用于执行 R 或 Python 脚本的模块
  • 算法,包括:
    • 决策树
    • 决策林
    • 群集功能
    • 时序
    • 建议模型
    • 异常检测

查找模块:

  • 如果知道模块的名称,请使用字母 作为索引来快速查找特定的模块或算法。
  • 有关按功能类别分类的模块列表,请参阅 模块类别和说明

按字母顺序排列的模块表

模块名称 说明
添加列 将一组列从一个数据集添加到另一个数据集。
添加行 将一组行从输入数据集追加到另一个数据集的末尾。
应用筛选器 将筛选器应用于数据集的指定列。
应用数学运算 将数学运算应用于列值。
应用 SQL 转换 对输入数据集运行 SQLite 查询以转换数据。
应用转换 将指定良好的数据转换应用于数据集。
将数据分配到群集 使用现有已训练的聚类分析模型将数据分配给群集。
贝叶斯线性回归 创建贝叶斯线性回归模型。
提升决策树回归 使用提升决策树算法创建回归模型。
构建计数转换 创建用于生成功能的计数。
清理缺失数据 指定如何处理数据集中缺少的值。
剪切值 检测离群值,然后剪辑或替换其值。
计算基础统计 计算所选数据集列的指定摘要统计信息。
检测语言 检测输入文件中每行的语言。
计算线性相关性 计算数据集中列值之间的线性关联。
转换为 ARFF 将数据输入转换为 Weka 工具集使用的属性关系文件格式。
转换为 CSV 将数据输入转换为逗号分隔值格式。
转换为数据集 将数据输入转换为数据输入所使用的内部数据集机器学习。
转换为指示器值 将列中的分类值转换为指示器值。
转换为 SVMLight 将数据输入转换为 SVMlight 框架使用的格式。
转换为 TSV 将数据输入转换为制表符分隔的格式。
创建 R 模型 使用自定义资源创建 R 模型。
交叉验证模型 通过将数据分区,交叉验证分类或回归模型的参数估计值。
决策林回归 使用决策林算法创建回归模型。
检测语言 检测输入文件中每行的语言。
编辑元数据 编辑与数据集中的列关联的元数据。
手动输入数据 通过键入值启用输入和编辑小型数据集。
评估模型 使用标准指标评估评分分类或回归模型。
评估概率函数 适合数据集的指定概率分布函数。
评估推荐器 评估推荐器模型预测的准确性。
执行 Python 脚本 从试验中执行 Python 机器学习脚本。
执行 R 脚本 从试验中执行 R 机器学习脚本。
导出计数表 从计数转换导出计数。
导出数据 将数据集写入 Web URL 或 Azure 中各种基于云的存储形式,例如表、blob 和Azure SQL数据库。

此模块以前名为 Writer
从文本中提取关键短语 从文本列中提取关键字和短语。
从文本中提取 N 元语法特征 创建 N 语法字典功能,然后对它们执行功能选择。
快速林分位回归 创建分位回归模型。
特征哈希 使用 Vowpal Wabbit 库将文本数据转换为整数编码的功能。
基于筛选器的特征选择 标识数据集中具有最高预测能力的功能。
FIR 过滤器 创建用于信号处理的有限脉冲响应筛选器。
费舍尔线性判别分析 标识可将数据最好地分组到单独的类中的特征变量的线性组合。
组分类值 将来自多个类别的数据分组到一个新类别中。
将数据分组到箱中 将数值数据放入储箱。
IIR 过滤器 为信号处理创建无限脉冲响应筛选器。
导入计数表 从现有计数表中导入计数。
导入数据 从 web 上的外部源或 Azure 中的各种形式的基于云的存储(如表、blob、SQL 数据库和 Azure Cosmos DB)加载数据。 如果网关已配置,则可以从本地 SQL Server 数据库加载数据。

此模块以前名为 " 读取器"。
导入图像 将 Azure Blob 存储中的图像加载到数据集。
联接数据 联接两个数据集。
K 均值聚类分析 配置和初始化 K 平均值聚类分析模型。
隐性 Dirichlet 分配 使用用于潜在 Dirichlet 分配 (LDA) 的 Vowpal Wabbit 库来执行主题建模。
线性回归 创建线性回归模型。
加载已训练的模型 获取可用于在实验中评分的定型模型。
中间值过滤器 创建用于平滑数据以进行趋势分析的中间筛选器。
合并计数转换 合并两组计数表。
修改计数表参数 从计数表中生成一个精简的基于计数的特征集。
移动平均线过滤器 创建用于平滑数据以进行趋势分析的移动平均线筛选器。
多类决策林 使用决策林算法创建多类分类模型。
多类决策林 使用决策蛙鸣算法创建多类分类模型。
多类逻辑回归 创建多类逻辑回归分类模型。
多类神经网络 使用神经网络算法创建多类分类模型。
命名实体识别 识别文本列中的命名实体。
神经网络回归 使用神经网络算法创建回归模型。
规范化数据 重新缩放数值数据,以将数据集值限制为标准范围。
单类支持向量机 为异常检测创建单类支持向量机模型。
“一对多”多类分类 从二元分类模型的系综创建多类分类模型。
顺序回归 创建顺序回归模型。
分区和采样 基于采样创建数据集的多个分区。
排列特征重要性 计算定型模型和测试数据集中的特征变量的排列特征重要性分数。
基于 PCA 的异常情况检测 使用主体组件分析 (PCA) 创建异常情况检测模型。
泊松回归 创建一个回归模型,该模型假定数据具有泊松分布。
预处理文本 对文本执行清理操作。
预先训练的级联图像分类 使用 OpenCV 库为正面面部创建预先训练图像分类模型。
主体组件分析 计算一组功能,这些功能缩减了维数以实现更高效的学习。
删除重复的行 从数据集中删除重复行。
替换离散值 将一个列中的离散值替换为基于另一个列的数字值。
评分 Matchbox 推荐器 通过使用 Matchbox 推荐器来对数据集进行评分。
评分模型 对定型分类或回归模型的预测进行评分。
对 Vowpal Wabbit 7-4 模型评分 使用 Vowpal Wabbit 机器学习系统为数据评分。

需要使用 Vowpal Wabbit 版本7-4 和7-6 生成的定型模型。
对 Vowpal Wabbit 7-10 模型评分 使用 Vowpal Wabbit 机器学习系统为数据评分。

需要使用 Vowpal Wabbit 版本7-10 生成的定型模型。
对 Vowpal Wabbit 8 模型评分 使用命令行界面中的 Vowpal Wabbit 机器学习系统对数据进行评分。

需要使用 Vowpal Wabbit 版本8生成定型模型。
在数据集中选择列 选择要包含在操作中的数据集或从中排除的列。
SMOTE 使用综合少数过度抽样,增加数据集中的低级示例数。
拆分数据 将数据集的行分区为两个不同的集。
汇总数据 为数据集中的列生成基本的描述性统计信息报表。
整理群集 对聚类分析模型执行参数扫描,以确定最佳参数设置。
使用 T-Test 测试假设 使用 t-test 比较两个数据集中的含义。
阈值过滤器 创建限制值的阈值筛选器。
Time Series Anomaly Detection (时序异常情况检测) 了解时序数据的趋势,然后使用趋势来检测异常。
训练异常情况检测模型 训练异常检测器模型,然后标记训练集的数据。
训练群集模型 训练聚类分析模型,然后将训练集中的数据分配给群集。
训练 Matchbox 推荐器 使用 Matchbox 算法训练贝叶斯推荐器。
训练模型 以监督方式训练分类或回归模型。
训练 Vowpal Wabbit 7-4 模型 从 Vowpal Wabbit 机器学习系统训练模型。

此模块与 Vowpal Wabbit 版本 7-4 和 7-6 兼容。
训练 Vowpal Wabbit 7-10 模型 从 Vowpal Wabbit 机器学习系统训练模型。

此模块适用于 Vowpal Wabbit 版本 7-10。
训练 Vowpal Wabbit 8 模型 使用 Vowpal Wabbit 机器学习系统版本 8 训练模型。

此模块适用于 Vowpal Wabbit 版本 8。
优化模型超参数 对回归或分类模型执行参数扫描,以确定最佳参数设置。
双类平均感知器 创建平均感知器二元分类模型。
双类贝叶斯点机 创建贝叶斯点计算机二元分类模型。
双类提升决策树 使用提升决策树算法创建二元分类器。
双类决策林 使用决策林算法创建双类分类模型。
双类决策林 使用决策算法创建双类分类模型。
双类局部深层支持向量机 使用本地深层支持向量机算法创建二元分类模型。
双类逻辑回归 创建双类逻辑回归模型。
双类神经网络 使用神经网络算法创建二元分类器。
双类支持向量机 使用支持向量机算法创建二元分类模型。
解压缩已压缩的数据集 从用户存储中的.zip包解压缩数据集。
用户定义的筛选器 创建自定义有限或无限脉冲响应筛选器。

另请参阅