数据转换 - 缩放和缩减
重要
对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。
ML 工作室(经典)文档即将停用,将来可能不会更新。
本文介绍 机器学习 Studio (经典) 中的模块,这些模块可帮助你处理数值数据。 对于机器学习,常见的数据任务包括剪切、分箱和规范化数值。 其他模块支持降维。
对数值数据建模
规范化、分箱或重新分发数值变量等任务是机器学习的数据准备的重要组成部分。 此组中模块支持以下数据准备任务:
- 将数据分组到不同大小或分布的箱中。
- 删除离群值或更改其值。
- 将一组数值规范化为特定范围。
- 从高维度数据集创建一组精简的特征列。
相关任务
- 选择要用于生成模型的相关有用功能:使用特征 选择 或 线性离散分析 模块。
- 根据值计数选择功能:将Learning计数模块。
- 删除或替换缺失值:使用 清理缺失数据 模块。
- 将分类值替换为从计算派生的数字值:使用 替换离散值 模块。
- 计算离散列或数值列的概率分布:使用 评估概率函数 模块。
- 筛选和转换数字信号和波形:使用 筛选器 模块。
模块列表
此 数据转换 - 缩放和缩减 类别包括以下模块: