移动平均线过滤器
重要
对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。
ML 工作室(经典)文档即将停用,将来可能不会更新。
创建一个移动平均线过滤器,用于平滑数据以进行趋势分析
类别: 数据转换/筛选器
模块概述
本文介绍如何使用 机器学习 Studio 中的移动平均值筛选器模块 (经典) ,使用指定的窗口长度计算数据集上的一系列单面或双面平均值。
定义满足需求的筛选器后,可以通过将其连接到 “应用筛选器” 模块将其应用到数据集中的选定列。 该模块执行所有计算,并将数值列中的值替换为相应的移动平均值。
你可以使用生成的移动平均线进行绘制和可视化,作为建模的新平滑基线,用于计算相似期间计算的方差等。
提示
需要筛选数据集中的数据或删除缺失值? 请改用以下模块:
了解和使用移动平均值
这种类型的平均值可帮助你揭示和预测回顾和实时数据中的有用临时模式。 最简单的移动平均线类型以系列的一些示例为起点,并使用该位置加上以前 n 位置的平均值而不是实际值。 (可以定义 n 作为赞。) 计算平均值的时间段 n 越长,值之间的方差就越小。 此外,如果增加所用值的数目,则单个值对生成的平均值的影响越小。
移动平均线可以是单侧或双侧。 在单侧平均值中,仅使用索引值之前的值。 在双侧平均值中,使用过去和未来的值。
当你正在阅读流式数据时,累积和加权移动平均线特别有用。 累积移动平均线会考虑当前之前的点。
在计算平均值时你可以同样加权所有数据点,或可以确保接近当前数据点的值更有效地加权。 在加权移动平均线中,所有权重总和必须为 1。
在指数移动平均线中,平均值包含头部和尾部,且可以加权此平均值。 轻度加权的尾部意味着尾部与标头非常接近,因此平均值的行为类似于在短加权期间移动的平均线。 尾部权重较重时,平均值的行为更像较长的简单移动平均线。
如何配置移动平均筛选器
将 移动平均值筛选器 模块添加到试验。 可以在“筛选”类别的“数据转换”下找到此模块。
对于 Length,请键入一个正整数值,该值定义应用筛选器的窗口的总大小。 这也称为筛选器 掩码。 对于移动平均值,筛选器的长度确定滑动窗口中的平均值。
较长的筛选器也称为 高阶 筛选器,并提供更大的计算窗口和更接近的趋势线。
较短或 较低的顺序 筛选器使用较小的计算窗口,更类似于原始数据。
对于 Type,请选择要应用的移动平均值的类型。
机器学习 Studio (经典) 支持以下类型的移动平均计算:
简单:简单的移动平均线 (SMA) 计算为未加权滚动平均值。
三角:三角移动平均值 (TMA) 是平滑趋势线的两倍。 三角字派生自应用于数据(强调中心值)的权重的形状。
指数简单:指数移动平均值 (EMA) 为最新数据提供更多权重。 权重呈指数级下降。
指数:经过修改的指数移动平均值计算正在运行的移动平均值,其中在任何一个点计算移动平均值都考虑以前计算的所有前一点的移动平均值。 此方法生成更流畅的趋势线。
累积:给定单点和当前移动平均值,累积移动平均值 (CMA) 计算当前点的移动平均值。
添加包含要计算其移动平均值的值的数据集,并添加 “应用筛选器” 模块。
连接“应用筛选器”的左侧输入移动平均筛选器,并将数据集连接到右侧输入。
在 “应用筛选器” 模块中,使用列选择器指定应应用筛选器的列。 默认情况下,筛选器转换应用于所有数值列,因此请务必排除任何没有适当数据的列。
运行试验。
对于筛选器长度参数定义的每个值集,当前 (或索引) 值将替换为移动平均值。
示例
有关如何在机器学习中使用筛选器的示例,请参阅 Azure AI 库中的此试验:
- 筛选器:此试验使用工程的波形数据集演示所有筛选器类型。
模块参数
名称 | 范围 | 类型 | 默认 | 说明 |
---|---|---|---|---|
Length | >=1 | Integer | 5 | 设置移动平均窗口的长度 |
类型 | 任意 | MovingAverageType | 指定要创建的移动平均线类型 |
Outputs
名称 | 类型 | 说明 |
---|---|---|
“筛选器” | IFilter 接口 | 过滤器实现 |