絞り込みメール配信構造でのモデルの処理 (基本的なデータ マイニング チュートリアル)
作成したマイニング モデルを参照または操作する前に、Analysis Services プロジェクトをデプロイし、マイニング構造とマイニング モデルを処理する必要があります。
配置すると 、プロジェクトがサーバーに送信され、そのプロジェクト内のオブジェクトがサーバー上に作成されます。
処理 により、Analysis Services オブジェクトにリレーショナル データ ソースからのデータが設定されます。
モデルを使用するには、事前にそのモデルを配置して処理する必要があります。 また、新しいデータの追加などにより、モデルに変更を加えた場合は、モデルを再配置して再処理する必要があります。
HoldoutSeed との一貫性の確保
プロジェクトを配置し、構造とモデルを処理すると、データ構造内の個々の行が数値型のシード値に基づいてトレーニング セットまたはテスト セットに割り当てられます。 既定では、数値型のシード値は、データ構造の属性に基づいて計算されます。 ただし、モデルの特定の側面を変更すると、シード値も変更されるため、微妙に異なる結果につながります。 したがって、結果がここで説明したのと同じになるように、固定 ホールドアウト シード12
を任意に割り当てます。 提示されたシードは、サンプリング アルゴリズムの初期化に使用され、すべてのマイニング構造とそのモデルで同じ方法でデータが分割されるようにします。
この値は、トレーニング セット内に含まれるケースの数に影響しません。単純に、モデルを構築するたびに、同じ分割方法が使用されることを保証します。
ホールドアウト シードの詳細については、「 データ セットのトレーニングとテスト」を参照してください。
提示されたシードを設定するには
SQL Server Data Tools (SSDT) の [データ マイニング] Designerの [マイニング構造] タブまたは [マイニング モデル] タブをクリックします。
対象のメーリング マイニング構造 が [プロパティ ] ウィンドウに表示されます。
F4 キーを押して [プロパティ] ウィンドウが開かれていることを確認します。
CacheMode が KeepTrainingCases に設定されていることを確認します。
「HoldoutSeed」と入力
12
します。
モデルの配置と処理
データ マイニング Designerでは、モデルまたは基になるデータに加えた変更の範囲に応じて、処理するオブジェクトを決定できます。
ここでは、既存の設定に変更を加えるのではなく、新しいデータと新しいモデルを使用するため、構造とすべてのモデルを同時に処理します。
プロジェクトを配置してすべてのマイニング モデルを処理するには
[ マイニング モデル ] メニューの [ プロセス マイニング構造] と [すべてのモデル] を選択します。
マイニング構造に変更を加えた場合は、マイニング モデルを処理する前にプロジェクトをビルドして配置するように求められます。 [はい] をクリックします。
[処理マイニング構造 - 対象指定メーリング] ダイアログ ボックスで [実行] をクリックします。
[処理の進行状況] ダイアログ ボックスが開き、モデル処理の詳細が表示されます。 使用するコンピューターによっては、モデル処理に多少時間がかかる場合があります。
モデルの処理が完了したら、 [処理の進行状況] ダイアログ ボックスの [閉じる] をクリックします。
[マイニング構造の処理 - <構造>] ダイアログ ボックスで [閉じる] をクリックします。
このレッスンの前の作業
絞り込みメール配信構造への新しいモデルの追加 (基本的なデータ マイニング チュートリアル)
次のレッスン
レッスン 4: 絞り込みメール配信モデルの検証 (基本的なデータ マイニング チュートリアル)