時系列予測での更新後のデータの使用 (中級者向けデータ マイニング チュートリアル)
拡張売上データを使用した予測の作成
このレッスンでは、モデルに新しい売上データを追加する予測クエリを作成します。 新しいデータでモデルを拡張することにより、最新のデータ ポイントを含む現時点での予測を取得できます。
新しいデータを使用する時系列予測の作成は簡単です。 PredictTimeSeries (DMX) 関数にパラメーター EXTEND_MODEL_CASESを追加し、新しいデータのソースを指定し、取得する予測の数を指定するだけです。
警告
パラメーター EXTEND_MODEL_CASES は省略可能です。既定では、入力として新しいデータを結合して時系列予測クエリを作成するたびに、モデルが拡張されます。
予測クエリを作成して新しいデータを追加するには
モデルがまだ開いていない場合は、予測構造をダブルクリックし、[データ マイニング] Designerで [マイニング モデルの予測] タブをクリックします。
[ マイニング モデル ] ウィンドウで、モデルの予測が既に選択されている必要があります。 選択されていない場合は、[モデルの 選択] をクリックし、モデルの予測を選択します。
[ 入力テーブルの選択 ] ウィンドウで、[ ケース テーブルの選択] をクリックします。
[ テーブルの選択 ] ダイアログ ボックスで、データ ソース Adventure Works DW 多次元 2012 を選択します。
データ ソース ビューの一覧から [NewSalesData] を選択し、[OK] をクリック します。
デザイン領域のサーフェスを右クリックし、[接続の 変更] を選択します。
[ マッピングの変更 ] ダイアログ ボックスを使用して、次のようにモデル内の列を外部データの列にマップします。
マイニング モデルの ReportingDate 列を、入力データの NewDate 列にマップします。
マイニング モデルの Amount 列を、入力データの NewAmount 列にマップします。
マイニング モデルの Quantity 列を、入力データの NewQty 列にマップします。
マイニング モデルの ModelRegion 列を、入力データの [系列] 列にマップします。
ここで、予測クエリを作成します。
最初に、列を予測クエリに追加し、予測を適用する系列を出力します。
グリッドで、最初の空の行をクリックし、[ ソース] の下にある [予測] を選択します。
[ フィールド ] 列で [モデル領域] を選択し、[ エイリアス] に「」と入力します
Model Region
。
次に、予測関数を追加して編集します。
空の行をクリックし、[ ソース] で [ 予測関数] を選択します。
[フィールド] で、[PredictTimeSeries] を選択します。
[ エイリアス] に「 Predicted Values」と入力します。
[ マイニング モデル ] ペインから [ 抽出条件/引数 ] 列に [数量] フィールドをドラッグします。
[ 抽出条件/引数] 列のフィールド名の後に、次のテキストを入力します: 5,EXTEND_MODEL_CASES
[ 抽出条件/引数 ] テキスト ボックスの完全なテキストは次のようになります。
[Forecasting].[Quantity],5,EXTEND_MODEL_CASES
[ 結果 ] をクリックし、結果を確認します。
予測は 7 月 (元のデータが終了した後の最初のタイム スライス) から開始し、11 月 (元のデータが終了した後の 5 番目のタイム スライス) で終了しています。
この種の予測クエリを効率よく使用するには、古いデータがいつ終了し、新しいデータにタイム スライスがいくつあるかを知る必要があります。
たとえば、このモデルでは、元のデータ系列は 6 月に終了し、データは 7 月、8 月、9 月のものになります。
EXTEND_MODEL_CASES を使用する予測は常に、元のデータ系列の終了から開始します。 そのため、不明の月の予測のみを取得するには、予測の開始位置と終了位置を指定する必要があります。 どちらの値も、古いデータの終わりから始まるタイム スライスの数として指定されます。
次の手順は、これを行う方法を示します。
予測の開始位置と終了位置を変更します。
予測クエリ ビルダーで、[ クエリ ] をクリックして DMX ビューに切り替えます。
PredictTimeSeries 関数が含まれている DMX ステートメントを見つけて、次のように変更します。
PredictTimeSeries([Forecasting 12].[Quantity],4,6,EXTEND_MODEL_CASES)
[ 結果 ] をクリックし、結果を確認します。
予測が 10 月 (元のデータが終了してから 4 番目のタイム スライス) から開始し、12 月 (元のデータが終了してから 6 番目のタイム スライス) で終了するようになります。
このレッスンの次の作業
時系列予測での置き換え後のデータの使用 (中級者向けデータ マイニング チュートリアル)
参照
Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
タイム シリーズ モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)