予測用のデータ ソース ビューの追加 (中級者向けデータ マイニング チュートリアル)
この作業では、予測シナリオに使用するデータ ソース ビューを追加します。 予測モデルでは、時系列内のステップを識別するための列がデータに含まれている必要があります。 複数の系列のデータを分析する場合は、すべての系列が終了する日付または時間ステップが同じである必要があります。
データ ソース ビューを追加するには
ソリューション エクスプローラーで、[データ ソース ビュー] を右クリックし、[新しいデータ ソース ビュー] を選択します。
[データ ソース ビュー ウィザードへようこそ] ページで [次へ] をクリックします。
[ データ ソースの選択 ] ページの [ リレーショナル データ ソース] で、 AdventureWorksDW2012 データ ソースを選択します。 [次へ] をクリックします。
Note
このデータ ソースがない場合は、「 基本的なデータ マイニング チュートリアル」でデータ ソースを作成する手順を確認できます。
[ テーブルとビューの選択 ] ページで、テーブル vTimeSeries (dbo) を選択し、右矢印をクリックしてデータ ソース ビューに追加します。
[次へ] をクリックします。
[ ウィザードの完了 ] ページで、既定ではデータ ソース ビューの名前は Adventure Works DW 多次元 2012 です。 名前を SalesByRegion に変更し、[完了] をクリック します。
データ ソース ビュー Designerが開き、SalesByRegion データ ソース ビューが表示されます。
データ ソース ビューの使用
データ ソース ビューを作成したら、次の方法でデータを検証できます。
デザイナーでテーブル vTimeSeries を右クリックし、[ データの探索 ] を選択して、選択したテーブルをグリッドで開きます。
[ サンプリング オプション ] をクリックし 、[データ探索オプション] ダイアログ ボックスを使用してサンプリング方法を変更します。 [ 更新 ] をクリックして、新しいオプション設定を使用してテーブルにデータを読み込みます。 たとえば、サンプルで出力する行数を指定したり、上位 n 行を選択したりできます。
テーブル vTimeSeries を右クリックし、[ プロパティ ] を選択してテーブルに新しい名前を割り当てます。 データ ソース ビューから個々の列を選択して、列のプロパティを変更することもできます。
データ ソース ビューのデザイン領域の任意の場所をクリックして、新しいクエリの作成と名前の割り当て、テーブル間のリレーションシップの作成、デザイン領域のレイアウトの変更を行います。
テーブルを右クリックし、[ 新しい名前付き計算 ] を選択して、集計を含む派生列を作成します。 また、このビューではデータ ソースから新しいテーブルやビューを追加することもできます。
次の作業では、時系列データについて学習し、時系列識別子として使用するのに最適な列を決定します。 時系列データのギャップを処理する方法についても学習します。
このレッスンの次の作業
時系列モデルの要件について (中級者向けデータ マイニング チュートリアル)