フィルタ選択されたモデルのテスト (基本的なデータ マイニング チュートリアル)
TM_Decision_Tree モデルが最も正確であることを確認できたら、Adventure Works Cycles の絞り込みメール配信キャンペーンのコンテキストでモデルを評価する必要があります。Adventure Works Cycles のマーケティング部門は、自転車購入者の特性に男性と女性における違いがあるかどうかを把握しようとしています。この情報は、広告用に使用する雑誌やダイレクト メールで特集する製品を決定する際に役立ちます。
このレッスンでは、性別に基づいてフィルタ選択されたモデルを作成します。その後、このモデルをコピーし、フィルタ条件を変更するだけで、別の性別に基づく新しいモデルを生成できます。
フィルタの詳細については、「マイニング モデルのフィルタの作成 (Analysis Services - データ マイニング)」を参照してください。
フィルタの使用
フィルタ選択を行うと、データのサブセットに基づくモデルを簡単に作成できます。フィルタはモデルにのみ適用され、基になるデータ ソースは変更しません。入れ子になったテーブルへのフィルタの適用については、「中級者向けデータ マイニング チュートリアル (Analysis Services - データ マイニング)」を参照してください。
ケース テーブルに対するフィルタ
まず、TM_Decision_Tree モデルのコピーを作成します。
デシジョン ツリー モデルをコピーするには
Business Intelligence Development Studio のソリューション エクスプローラで、[ASDataMining2008] を選択します。
[マイニング モデル] タブをクリックします。
TM_Decision_Tree モデルを右クリックして、[新しいマイニング モデル] をクリックします。
[モデル名] フィールドに「TM_Decision_Tree_Male」と入力します。
[OK] をクリックします。
次に、性別に基づいてモデルの顧客を選択するフィルタを作成します。
マイニング モデルに対してケース フィルタを作成するには
TM_Decision_Tree_Male マイニング モデルを右クリックしてショートカット メニューを開きます。
または
モデルを選択します。[マイニング モデル] メニューの [モデル フィルタの設定] をクリックします。
[モデル フィルタ] ダイアログ ボックスで、[マイニング構造列] ボックスのグリッドの先頭行をクリックします。
ドロップダウン リストに、そのテーブルの列の名前のみが表示されます。
[マイニング構造列] ボックスで、[Gender] をクリックします。
テキスト ボックスの左側のアイコンが変化して、選択されたアイテムがテーブルであるか列であるかが示されます。
[演算子] ボックスをクリックし、一覧から等号 (=) 演算子を選択します。
[値] ボックスをクリックし、「M」と入力します。
グリッドの次の行をクリックします。
[OK] をクリックして [モデル フィルタ] を閉じます。
フィルタが [プロパティ] ウィンドウに表示されます。[プロパティ] ウィンドウから [モデル フィルタ] ダイアログ ボックスを開くこともできます。
上記の手順を繰り返しますが、今回はモデルに「TM_Decision_Tree_Female」という名前を付け、[値] ボックスに「F」と入力します。
これで、[マイニング モデル] タブに 2 つの新しいモデルが表示されるようになりました。
フィルタ選択されたモデルの処理
モデルを使用するには、事前にそのモデルを配置して処理する必要があります。モデルの処理の詳細については、「絞り込みメール配信構造でのモデルの処理 (基本的なデータ マイニング チュートリアル)」を参照してください。
フィルタ選択されたモデルを処理するには
[TM_Decision_Tree_Male] モデルを右クリックして、[マイニング構造および全モデルの処理] をクリックします。
[実行] をクリックして新しいモデルを処理します。
処理が完了したら、両方の処理ウィンドウの [閉じる] をクリックします。
結果の評価
結果を表示してフィルタ選択されたモデルの精度を評価する方法は、前の 3 つのモデルの場合とほぼ同じです。詳細については、以下のトピックを参照してください。
デシジョン ツリー モデルの検証 (基本的なデータ マイニング チュートリアル)
リフト チャートを使用した精度テスト (基本的なデータ マイニング チュートリアル)
フィルタ選択されたモデルを調査するには
データ マイニング デザイナで、[マイニング モデル ビューア] タブをクリックします。
[マイニング モデル] ボックスで、[TM_Decision_Tree_Male] を選択します。
[表示レベル] を 3 までスライドさせます。
[背景] の値を 1 に変更します。
"すべて" というラベルが付いたノードの上にカーソルを置き、自転車購入者数と自転車非購入者数を比較します。
TM_Decision_Tree_Female に対して手順 1. ~ 5. を繰り返します。
TM_Decision_Tree と性別に基づいてフィルタ選択されたモデルの結果を検証します。すべての自転車購入者と比較すると、男性の自転車購入者および女性の自転車購入者には、フィルタ選択されていない自転車購入者と同じ特性もいくつかありますが、この 3 者には興味深い相違点もあります。Adventure Works Cycles は、この有益な情報を使用してマーケティング キャンペーンを展開できます。
フィルタ選択されたモデルのリフトをテストするには
Business Intelligence Development Studio のデータ マイニング デザイナの [マイニング精度チャート] タブに切り替えて、[入力の選択] タブをクリックします。
[精度チャートに使用するデータセットの選択] グループ ボックスで、[マイニング構造のテスト ケースを使用する] をクリックします。
データ マイニング デザイナの [入力の選択] タブにある [リフト チャートに表示する予測可能なマイニング モデル列の選択] で、[予測列と値の同期] チェック ボックスをオンにします。
[予測可能列名] 列で、各モデルについて [Bike Buyer] が選択されていることを確認します。
[表示] 列で、各モデルのチェック ボックスをオンにします。
[予測値] 列で [1] を選択します。
[リフト チャート] タブをクリックして、リフト チャートを表示します。
3 つすべてのデシジョン ツリー モデルでランダム推測モデルからの大幅なリフトが見られ、クラスタ モデルや Naive Bayes モデルより高精度であることがわかります。