レッスン 1: 時系列マイニング モデルおよびマイニング構造の作成
このレッスンでは、履歴データを基に時間の経過に応じて値を予測するためのマイニング モデルを作成します。 モデルを作成すると、基になる構造が自動的に生成され、追加のマイニング モデルのベースとして使用できるようになります。
このレッスンは、予測モデルおよび Microsoft Time Series アルゴリズムの要件について理解していることを前提としています。 詳細については、「 Microsoft Time Series アルゴリズム」を参照してください。
CREATE MINING MODEL ステートメント
マイニング モデルを直接作成し、基になるマイニング構造を自動的に生成するには、 CREATE MINING MODEL (DMX) ステートメントを使用します。 ステートメントのコードは、次の部分に分けることができます。
モデルの名前指定
タイム スタンプの定義
省略可能な系列キー列の定義
予測可能な属性の定義
CREATE MINING MODEL ステートメントの汎用例を次に示します。
CREATE MINING MODEL [<Mining Structure Name>]
(
<key columns>,
<predictable attribute columns>
)
USING <algorithm name>([parameter list])
WITH DRILLTHROUGH
コードの 1 行目では、マイニング モデルの名前を定義します。
CREATE MINING MODEL [Mining Model Name]
Analysis Services では、基になる構造に対し、モデル名の後に「_structure」を追加した名前が自動的に生成されます。これにより、構造名がモデル名と重複しないことが保証されます。 DMX でのオブジェクトの名前付けの詳細については、「 識別子 (DMX)」を参照してください。
コードの次の行では、マイニング モデルのキー列を定義します。キー列は、時系列モデルでソース データの時間ステップを一意に識別します。 時間ステップは、列名とデータ型の KEY TIME
後のキーワードで識別されます。 時系列モデルに別の系列キーが含まれている場合は、KEY
キーワードでそのキーが識別されます。
<key columns>
コードの次の行では、予測対象となるモデル内の列を定義します。 1 つのマイニング モデルに複数の予測可能な属性を含めることができます。 予測可能な属性が複数ある場合は、Microsoft Time Series アルゴリズムによって系列ごとに個別に分析が生成されます。
<predictable attribute columns>
このレッスンの作業
このレッスンでは、次のタスクを実行します。
新しい空のクエリの作成
マイニング モデルを作成するためのクエリの変更
クエリを実行します
クエリの作成
最初の手順は、Analysis Services のインスタンスに接続し、SQL Server Management Studioで新しい DMX クエリを作成することです。
SQL Server Management Studio で新しい DMX クエリを作成するには
SQL Server Management Studio を開きます。
[ サーバーへの接続 ] ダイアログ ボックスの [ サーバーの種類] で、[ Analysis Services] を選択します。 [ サーバー名] に、「」と入力するか、このレッスンで接続する Analysis Services のインスタンスの名前を入力
LocalHost
します。 [Connect] をクリックします。オブジェクト エクスプローラーで Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして、[DMX] をクリックします。
クエリ エディターが開き、新しい空のクエリが表示されます。
クエリの変更
次の手順では、CREATE MINING MODEL ステートメントを変更して、予測に使用されるマイニング モデルがその基になるマイニング構造と共に作成されるようにします。
CREATE MINING MODEL ステートメントをカスタマイズするには
クエリ エディターで、CREATE MINING MODEL ステートメントの汎用例を空のクエリにコピーします。
次の部分を探します。
[mining model name]
次の内容に置き換えます。
[Forecasting_MIXED]
次の部分を探します。
<key columns>
次の内容に置き換えます。
[Reporting Date] DATE KEY TIME, [Model Region] TEXT KEY
TIME KEY
キーワードは、ReportingDate 列に値を順に並べるための時間ステップ値が含まれていることを示します。 時間ステップのデータ型は、値が一意でデータの並べ替えが可能であれば、日付/時刻型、整数型、任意の順序付きデータ型のどれでもかまいません。TEXT
キーワードとKEY
キーワードは、ModelRegion 列に追加の系列キーが含まれていることを示します。 使用できる系列キーは 1 つに限られており、列内の値は一意である必要があります。次の部分を探します。
< predictable attribute columns> )
次の内容に置き換えます。
[Quantity] LONG CONTINUOUS PREDICT, [Amount] DOUBLE CONTINUOUS PREDICT )
次の部分を探します。
USING <algorithm name>([parameter list]) WITH DRILLTHROUGH
次の内容に置き換えます。
USING Microsoft_Time_Series(AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED') WITH DRILLTHROUGH
アルゴリズム パラメーター
AUTO_DETECT_PERIODICITY
= 0.8 では、アルゴリズムでデータの周期を検出するように指定しています。 1 に近い値を設定すると、多数のパターンを検出できますが、処理に時間がかかる可能性があります。アルゴリズム パラメーター
FORECAST_METHOD
では、ARTXP、ARIMA、ARTXP と ARIMA の両方のうち、どれを使用してデータを分析するかを指定します。キーワード
WITH DRILLTHROUGH
では、モデルが完成した後にソース データの詳細な統計を表示できるようにすることを指定します。 Microsoft タイム シリーズ ビューアーでモデルを参照する場合は、この句を追加する必要があります。 予測にはこの句は必要ありません。最終的なステートメントは次のようになります。
CREATE MINING MODEL [Forecasting_MIXED] ( [Reporting Date] DATE KEY TIME, [Model Region] TEXT KEY, [Quantity] LONG CONTINUOUS PREDICT, [Amount] DOUBLE CONTINUOUS PREDICT ) USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED') WITH DRILLTHROUGH
[ ファイル ] メニューの [ DMXQuery1.dmx As の保存] をクリックします。
[ 名前を付けて保存 ] ダイアログ ボックスで、適切なフォルダーを参照し、ファイルに という名前を付けます
Forecasting_MIXED.dmx
。
クエリの実行
最後の手順では、クエリを実行します。 クエリを作成して保存したら、そのクエリを実行してサーバーにマイニング モデルとそのマイニング構造を作成します。 クエリ エディターでのクエリの実行の詳細については、「データベース エンジンのクエリ エディター (SQL Server Management Studio)」を参照してください。
クエリを実行するには
クエリ エディターで、ツール バーの [実行] をクリックします。
クエリの状態は、ステートメントの実行が完了した後、クエリ エディターの下部にある [メッセージ] タブに表示されます。 この場合次のメッセージが表示されます。
Executing the query Execution complete
Forecasting_MIXED_Structure という名前 の 新しい構造が、関連するマイニング モデル Forecasting_MIXEDと共にサーバー上に存在するようになりました。
次のレッスンでは、作成した Forecasting_MIXED マイニング構造にマイニング モデルを追加します。
次のレッスン
レッスン 2: 時系列マイニング構造へのマイニング モデルの追加
参照
タイム シリーズ モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)
Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス