移動平均フィルター

[アーティクル]
05/06/2019

重要

Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。その日までに、Azure Machine Learning に切り替えすることをお勧めします。

2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。

ML Studio (クラシック) から Azure Machine Learning への機械学習プロジェクトの移動に関する情報を参照してください。
Azure Machine Learning についての詳細を参照してください。

ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。

傾向分析のためのデータ平滑化に使用する移動平均フィルターを作成します

カテゴリ: データ変換/フィルター

Note

適用対象: Machine Learning Studio (クラシック) のみ

類似のドラッグアンドドロップモジュールは Azure Machine Learning デザイナーで使用できます。

モジュールの概要

この記事では、Machine Learning Studio (クラシック) の移動平均フィルター モジュールを使用して、指定したウィンドウ長を使用して、データセットに対する一連の片面または両面平均を計算する方法について説明します。

ニーズに合ったフィルターを定義したら、データセット内の選択した列にフィルターを適用するには、[ フィルターの適用] モジュールに接続します。モジュールはすべての計算を行い、数値列内の値を対応する移動平均に置き換えます。

結果として得られる移動平均は、プロットや視覚化に使用できるほか、モデリング用の新しい平滑ベースラインとして、また、類似する期間の計算結果に対する分散の計算などにも使用できます。

ヒント

データセットからデータをフィルター処理するか、欠損値を削除する必要がありますか? 代わりに、次のモジュールを使用します。

欠損データのクリーンアップ: このモジュールを使用して、欠損値を削除するか、欠損値をプレースホルダーに置き換えます。
パーティションとサンプル: このモジュールを使用して、日付の範囲、特定の値、正規表現などの条件でデータセットを分割またはフィルター処理します。
クリップ値: このモジュールを使用して範囲を設定し、その範囲内の値のみを保持します。

移動平均の理解と使用

この種類の平均は、遡及的データとリアルタイムデータにおいて有用な時系列パターンを明らかにし、予測するのに役立ちます。最も単純な種類の移動平均は、連続するデータのいくつかのサンプルから開始し、その位置と、さらに前の n 個の位置の平均値を実際の値の代わりに使用します。 (n は好きなように定義できます)。平均が計算される期間 n が長いほど、値間の分散が少なくなります。また、使用する値の数を増やすと、結果として得られる平均値にどれか 1 つの値が与える影響は小さくなります。

移動平均は、片側か両側かを選択できます。片側平均では、インデックス値の前の値のみを使用します。両面平均では、過去および未来の値を使用します。

ストリーミングデータを読み込むシナリオでは、累積移動平均と加重移動平均が特に便利です。 累積移動平均は、現在の期間より前の時点を計算に入れます。

平均を計算する際は、すべてのデータポイントに均等に重み付けをするか、現在のデータポイントに近い値により強い重み付けがされるよう指定できます。 加重移動平均では、すべての重みの合計が 1 になる必要があります。

指数移動平均では、平均値は、重み付けができる先頭と末尾で構成されます。末尾に弱い重み付けをすると、末尾が先頭のすぐ近くに続くことになるため、その平均は短い重み付け期間での移動平均に似た振る舞いをします。末尾の重み付けが強い場合、平均はより長い単純移動平均のように振る舞います。