予測の作成 (基本的なデータ マイニング チュートリアル)
マイニング モデルの精度をテストして十分な結果が得られたら、データ マイニング デザイナーの [マイニング モデル予測] タブをクリックし、予測クエリ ビルダーを使用してデータ マイニング拡張機能 (DMX) 予測クエリを作成します。
予測クエリ ビルダーには 3 つのビューがあります。 デザイン ビューとクエリ ビューでは、クエリの作成と検証を行います。 次に、クエリを実行してその結果を結果ビューに表示します。
予測クエリ ビルダーの使用法の詳細については、「DMX 予測クエリの作成」を参照してください。
クエリの作成
予測クエリを作成するには、まず、マイニング モデルと入力テーブルを選択します。
モデルと入力テーブルを選択するには
データ マイニング デザイナーの [マイニング モデル予測] タブを開き、[マイニング モデル] ボックスの [モデルの選択] をクリックします。
[マイニング モデルの選択] ダイアログ ボックスで、ツリーの [Targeted Mailing] 構造に移動し、その構造を展開して [TM_Decision_Tree] を選択し、[OK] をクリックします。
[入力テーブルの選択] ボックスで、[ケース テーブルの選択] をクリックします。
[テーブルの選択] ダイアログ ボックスで、[データ ソース] ボックスの一覧から [Adventure Works DW2008] を選択します。
[テーブル名またはビュー名] ボックスで [ProspectiveBuyer (dbo)] テーブルを選択し、[OK] をクリックします。
ProspectiveBuyer テーブルは、vTargetMail ケース テーブルに非常に似ています。
列のマッピング
入力テーブルを選択すると、列名に基づいてマイニング モデルと入力テーブルの間に既定のマッピングが作成されます。 構造の列と外部データの列は 1 つ以上一致する必要があります。
重要 |
---|
モデルの精度を判断するために使用するデータには、予測可能列にマッピングできる列が含まれている必要があります。 |
構造の列を入力テーブルの列にマッピングするには
[マイニング モデル] ウィンドウと [入力テーブルの選択] ウィンドウを接続する線を右クリックし、[接続の変更] をクリックします。
すべての列をマップするわけではありません。 いくつかの [テーブル列] のマッピングを追加します。
[テーブル列] で [Bike Buyer] セルをクリックし、ドロップダウンから [ProspectiveBuyer.Unknown] を選択します。
これで、予測可能列 [Bike Buyer] が入力テーブルの列にマップされます。
[OK] をクリックします。
ソリューション エクスプローラーで、[Targeted Mailing] データ ソース ビューを右クリックし、[ビュー デザイナー] をクリックします。
ProspectiveBuyer テーブルのタイトルを右クリックし、[新しい名前付き計算] をクリックします。
[列名] ボックスに「calcAge」と入力します。
[式] ボックスに「DATEDIFF(YYYY,[BirthDate],getdate())」と入力し、[OK] をクリックします。
入力テーブルには、対応する Age 列がありません。 この式は、入力テーブルの BirthDate 列から顧客の年齢を計算します。 Age 列は、自転車の購入の予測に最も大きく影響する列と見なされているため、モデルと入力テーブルの両方に存在する必要があります。
データ マイニング デザイナーで、[マイニング モデル予測] タブをクリックして [接続の変更] ウィンドウを再度開きます。
[テーブル列] で [Age] セルをクリックし、ドロップダウンから [ProspectiveBuyer.calcAge] を選択します。
[OK] をクリックします。
予測クエリのデザイン
予測クエリをデザインするには
[マイニング モデル予測] タブのツール バーにある最初のボタンは、[デザイン ビューに切り替え]/[結果ビューに切り替え]/[クエリ ビューに切り替え] ボタンです。 このボタンの下矢印をクリックし、[デザイン] をクリックします。
[マイニング モデル予測] タブのグリッドで、[ソース] 列の最初の空白行のセルをクリックし、[予測関数] を選択します。
これにより、PredictProbability 関数の対象列を指定します。 関数の詳細については、「データ マイニング拡張機能 (DMX) 関数リファレンス」を参照してください。
"予測関数" 行の [フィールド] 列で [PredictProbability] を選択します。
[マイニング モデル] ウィンドウで、[Bike Buyer] をクリックし、[条件と引数] セルにドラッグします。
マウスを離すと、[TM_Decision_Tree].[Bike Buyer] が [条件と引数] セルに表示されます。
[ソース] 列で次の空白行をクリックし、[TM_Decision_Tree] を選択します。
TM_Decision_Tree 行の [フィールド] 列で、[Bike Buyer] を選択します。
TM_Decision_Tree 行の [条件と引数] 列に「=1」と入力します。
[ソース] 列で次の空白行をクリックし、[ProspectiveBuyer] を選択します。
ProspectiveBuyer 行の [フィールド] 列で、[ProspectiveBuyerKey] を選択します。
予測クエリに一意識別子が追加され、自転車を購入する傾向がある顧客とそうでない顧客を特定できるようになります。
グリッドに 5 つの行を追加します。 各行について、[ProspectiveBuyer] を [ソース] として選択し、[フィールド] セルに次の列を追加します。
calcAge
LastName
FirstName
AddressLine1
AddressLine2
最後に、クエリを実行して結果を参照します。
クエリを実行して結果を表示するには
[マイニング モデル予測] タブで [結果] ボタンをクリックします。
クエリを実行して結果が表示されたら、その結果を確認できます。
[マイニング モデル予測] タブには、自転車を購入する可能性がある潜在顧客の連絡先情報が表示されます。 [式] 列には、予測の精度が示されます。 これらの結果を使用すると、メールを送信する対象となる潜在顧客を特定できます。
[保存] ボタンをクリックして結果を保存します。