数据转换 - 筛选器

重要

对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习

从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。

ML 工作室(经典)文档即将停用,将来可能不会更新。

本文介绍如何使用 机器学习 Studio 中的筛选器模块 (经典) 转换数字数据。 适用于 机器学习 Studio (经典) 的这组工具中的模块基于为数字信号处理技术开发的筛选器。

注意

仅适用于机器学习 Studio (经典)

可在 Azure 机器学习设计器中获取类似的拖放模块。

筛选器通常应用于数据处理阶段或预处理阶段中的数据。 筛选器增强了用于机器学习的信号的清晰度。 例如,可以使用 机器学习 Studio 中的筛选器模块 (经典) 来处理这些处理任务:

  • 清理用于语音识别的波形。
  • 检测趋势或者消除干扰性销售或经济数据中的季节效应。
  • 分析遥测信号中的模式或项目。

这些模块使用经过精心研究的算法对波形数据进行数学转换,从而轻松配置筛选器。 如果你已确定要应用于数据的正确系数,还可以创建自定义过滤器。

如果需要执行诸如逐行从数据集中排除数据、删除缺失值或减小数据集大小等任务,请改用以下模块:

  • 清理缺失数据:删除缺失值,或将缺失值替换为占位符。
  • 分区和示例:使用日期范围、特定值或正则表达式等条件对数据集进行划分或筛选。
  • 剪辑值:设置一系列值,并仅保留该范围内的值。

数字信号处理中的筛选器

就像可以将筛选器附加到相机以补偿照明或创建特殊效果一样,可以将筛选器应用于用于机器学习的数据。 筛选器可以帮助提高信号的清晰度、捕获有趣的特征或降低噪音。

理想的筛选器将消除所有噪音,并且对所需信号具有统一的敏感度。 但是,设计甚至相当好的筛选器可能需要多次迭代或技术组合。 如果成功设计有效的筛选器,请考虑保存筛选器,以便在转换新数据时重复使用它。

一般情况下,过滤基于波形分析的原理。 设计筛选器时,可以查找抑制或放大信号部分的方法、公开基础趋势、减少干扰或识别可能不感知的数据值。

各种技术用于分解创建实际数据值的单个趋势或波形组件。 可以使用三角函数来识别和隔离单个波形,从而分析这些值系列。 (这是真实的,无论是经济序列还是音频信号的复合频率。) 筛选器随后可以应用于这些波形,以消除噪音,放大某些波形,或删除目标组件。

将过滤应用到干扰系列以隔离不同的组件时,你可以指定要使用的频段,从而确定要删除或加强的频率。

机器学习 Studio 中的数字筛选器 (经典)

机器学习 Studio (经典) 支持以下类型的筛选器:

  • 基于波形分解的筛选器。 例如,有限脉冲响应 (FIR) 和无限脉冲响应 (IIR) 筛选器。 这些筛选器的工作原理是从整体系列中删除特定组件。 然后,可以查看和调查简化的波形。
  • 基于移动平均数或中间值的过滤器。 这些过滤器通过对时间窗口内的数据进行平均值处理来平滑数据系列中的变化。 时限可以固定或滑动,并且可以具有不同的形状。 例如,三角窗口的峰值位于当前的数据点(所加的权重更强的当前值)和反面关闭之前和之后的数据点(权重之前和之后的值不太强)。
  • 用户定义的过滤器或自定义过滤器。 如果已知道应应用于数据系列的转换,则可以创建用户定义的筛选器。 提供应用于转换数据系列的数值系数。 自定义筛选器可以模拟 FIR 或 IIR 筛选器。 但是,使用自定义筛选器,可以更好地控制序列中每个点要应用的值。

筛选术语

以下列表包括筛选器的参数和属性中使用的术语的简单定义:

  • 传递带:可以经过筛选器而不衰减或削弱的频率范围。
  • 停止带:指定限制之间的频率范围,通过这些限制不传递信号。 你可以通过设置截止频率定义阻带。
  • 高传递:只允许高频率通过。
  • 低传递:仅接受低于指定截止值的频率。
  • :定义停止带和传递带频率之间的边界。 通常,你可以决定是在频带中包含还是排除角。 第一阶筛选器会导致逐渐衰减,直到角频率。 之后,筛选器会导致指数衰减。 高阶筛选器 (,如巴特沃斯和切比舍夫筛选器) 角频率后具有更陡峭的斜率。 高阶筛选器会更快速、更全面地衰减停止带中的值。
  • 带顶筛选器 (也称为 带拒绝 筛选器或 声道 筛选器) :只有一个停止带。 通过指定两个频率来定义停止带:高断点频率和低截止频率。 带通筛选器通常有两个停止带:一个位于所需组件的任一端。
  • 波纹:定期发生的小型不需要的变体。 在机器学习中,可以指定要容忍的波纹量作为 IIR 筛选器设计中的参数的一部分。

提示

需要更多信息? 如果不熟悉数字信号处理,请参阅 数字信号处理简介。 该网站提供定义和有用的视觉辅助工具,用于解释基本术语和概念。

模块列表

以下模块包含在 数据转换 - 筛选器 类别中:

另请参阅