中间值过滤器

重要

对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习

从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。

ML 工作室(经典)文档即将停用,将来可能不会更新。

创建用于平滑数据以进行趋势分析的中值滤波器

类别: 数据转换/筛选器

注意

仅适用于机器学习 Studio (经典)

可在 Azure 机器学习设计器中获取类似的拖放模块。

模块概述

本文介绍如何使用 机器学习 Studio (经典) 中的中值筛选器模块来定义一个中值筛选器,以应用于表示数字输入信号或图像的一系列值。

中间值过滤器广泛应用于图像识别以减少干扰,以便可以更轻松地检测到特征。

注意

筛选器是一个传输函数,它采用输入信号,并根据筛选器特征创建输出信号。 在数字信号处理过程中,使用过滤器可以改善图像或语音识别的结果。 有关详细信息,请参阅 筛选器

使用 中值筛选器 模块定义满足需求的筛选器转换后,可以通过将数据集和筛选器连接到 应用筛选器 模块,将筛选器应用于数据。

提示

需要筛选数据集中的数据或删除缺失值? 请改用以下模块:

  • 清理缺失数据:使用此模块删除缺失值或将缺失值替换为占位符。
  • 分区和示例:使用此模块按日期范围、特定值或正则表达式等条件划分或筛选数据集。
  • 剪辑值:使用此模块设置范围,并仅保留该区域内的值。

如何配置中值筛选器

  1. 中值筛选器 添加到试验。 可以在“筛选器”类别的“数据转换”下找到此模块。

  2. 对于 Length,请键入一个整数值,该值定义应用筛选器的窗口的总大小。 这也称为筛选器 掩码

    该值应为奇数、正值整数。 如果指定为偶数,则蒙板大小将减掉一。

    默认情况下,掩码从当前值开始,并创建一个以当前值为中心的窗口。

    例如,如果键入 5 作为 “长度 ”或“窗口大小”,则通过滑动窗口计算中值,其中包含以当前值为中心的 5 个值。 如果键入 4,掩码将减少到 3 个值,以索引值为中心。

  3. 连接要应用筛选器的筛选器,并连接数据集。

    使用列选择器指定应向其应用筛选器的数据集的列。 默认情况下, “应用筛选器” 模块将使用所有所选数值列的筛选器。

  4. 运行试验。 以下操作将应用于所选列:

    • 对于每个窗口或蒙板中包含的值集,过滤器算法将计算中值。
    • 当前(或索引)值将替换为中值。

示例

有关如何在机器学习中使用筛选器的示例,请参阅 Azure AI 库中的此试验:

  • 筛选器:此试验使用工程的波形数据集演示了所有筛选器类型。

技术说明

本部分包含实现详情、使用技巧和常见问题解答。

实现详细信息

输出信号中的每个条目都等于输入信号子集(蒙板)中条目的中值,并于相应索引处居中。 掩码大小应为奇数正整数。

如果为此方法提供偶数掩码大小,则会将提供的值减 1。 例如,给定 m=2q+1的筛选器定义为: yi = median[{xi-q,…, xi+q}]

超出输入信号边框的值假定等于边框上的值。 也就是说,如果 n 是输入信号的长度:

values beyond borders of median filter

有关中间值过滤器的详细信息,此维基百科文章提供了详细的理论和应用介绍:

维基百科:中值筛选器

模块参数

名称 范围 类型 默认 说明
长度 >=1 Integer 5 过滤窗口的长度

输出

名称 类型 说明
“筛选器” IFilter 接口 过滤器实现

另请参阅

Filter
应用筛选器
A-Z 模块列表