中间值过滤器
重要
对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。
ML 工作室(经典)文档即将停用,将来可能不会更新。
创建用于平滑数据以进行趋势分析的中值滤波器
类别: 数据转换/筛选器
模块概述
本文介绍如何使用 机器学习 Studio (经典) 中的中值筛选器模块来定义一个中值筛选器,以应用于表示数字输入信号或图像的一系列值。
中间值过滤器广泛应用于图像识别以减少干扰,以便可以更轻松地检测到特征。
注意
筛选器是一个传输函数,它采用输入信号,并根据筛选器特征创建输出信号。 在数字信号处理过程中,使用过滤器可以改善图像或语音识别的结果。 有关详细信息,请参阅 筛选器。
使用 中值筛选器 模块定义满足需求的筛选器转换后,可以通过将数据集和筛选器连接到 应用筛选器 模块,将筛选器应用于数据。
提示
需要筛选数据集中的数据或删除缺失值? 请改用以下模块:
如何配置中值筛选器
将 中值筛选器 添加到试验。 可以在“筛选器”类别的“数据转换”下找到此模块。
对于 Length,请键入一个整数值,该值定义应用筛选器的窗口的总大小。 这也称为筛选器 掩码。
该值应为奇数、正值整数。 如果指定为偶数,则蒙板大小将减掉一。
默认情况下,掩码从当前值开始,并创建一个以当前值为中心的窗口。
例如,如果键入 5 作为 “长度 ”或“窗口大小”,则通过滑动窗口计算中值,其中包含以当前值为中心的 5 个值。 如果键入 4,掩码将减少到 3 个值,以索引值为中心。
连接要应用筛选器的筛选器,并连接数据集。
使用列选择器指定应向其应用筛选器的数据集的列。 默认情况下, “应用筛选器” 模块将使用所有所选数值列的筛选器。
运行试验。 以下操作将应用于所选列:
- 对于每个窗口或蒙板中包含的值集,过滤器算法将计算中值。
- 当前(或索引)值将替换为中值。
示例
有关如何在机器学习中使用筛选器的示例,请参阅 Azure AI 库中的此试验:
- 筛选器:此试验使用工程的波形数据集演示了所有筛选器类型。
技术说明
本部分包含实现详情、使用技巧和常见问题解答。
实现详细信息
输出信号中的每个条目都等于输入信号子集(蒙板)中条目的中值,并于相应索引处居中。 掩码大小应为奇数正整数。
如果为此方法提供偶数掩码大小,则会将提供的值减 1。 例如,给定 m=2q+1
的筛选器定义为: yi = median[{xi-q,…, xi+q}]
超出输入信号边框的值假定等于边框上的值。 也就是说,如果 n 是输入信号的长度:
有关中间值过滤器的详细信息,此维基百科文章提供了详细的理论和应用介绍:
模块参数
名称 | 范围 | 类型 | 默认 | 说明 |
---|---|---|---|---|
长度 | >=1 | Integer | 5 | 过滤窗口的长度 |
输出
名称 | 类型 | 说明 |
---|---|---|
“筛选器” | IFilter 接口 | 过滤器实现 |