絞り込みメール配信マイニング モデル構造の作成 (基本的なデータ マイニング チュートリアル)
対象指定のメーリング シナリオを作成する最初の手順は、SQL Server Data Tools (SSDT) のデータ マイニング ウィザードを使用して、新しいマイニング構造とデシジョン ツリー マイニング モデルを作成することです。
このタスクでは、新しいマイニング構造を設定し、Microsoft デシジョン ツリー アルゴリズムに基づいて初期マイニング モデルを追加します。 マイニング構造を作成するには、まずテーブルとビューを選択し、トレーニングに使用する列とテストに使用する列を特定します。
絞り込みメール配信シナリオ用のマイニング構造を作成するには
ソリューション エクスプローラーで、[マイニング構造] を右クリックし、[新しいマイニング構造] を選択してデータ マイニング ウィザードを開始します。
[データ マイニング ウィザードへようこそ] ページで [次へ]をクリックします。
[ 定義方法の選択] ページで、[ 既存のリレーショナル データベースまたはデータ ウェアハウスから ] が選択されていることを確認し、[ 次へ] をクリックします。
[ データ マイニング構造の作成 ] ページの [ 使用するデータ マイニング手法] で、[ Microsoft デシジョン ツリー] を選択します。
注意
データ マイニング アルゴリズムが見つからないという警告が発生する場合は、プロジェクトのプロパティが適切に構成されていない可能性があります。 この警告は、プロジェクトが Analysis Services サーバーからデータ マイニング アルゴリズムの一覧を取得しようとしたときに、サーバーが見つからない場合に発生します。 既定では、SQL Server Data Toolsは localhost をサーバーとして使用します。 別のインスタンスまたは名前付きインスタンスを使用している場合は、プロジェクトのプロパティを変更する必要があります。 詳細については、「 Analysis Services プロジェクトの作成 (基本的なデータ マイニング チュートリアル)」を参照してください。
[次へ] をクリックします。
[ データ ソース ビューの選択 ] ページの [ 使用可能なデータ ソース ビュー ] ウィンドウで、[ 対象指定メール] を選択します。 [ 参照 ] をクリックしてデータ ソース ビューにテーブルを表示し、[ 閉じる ] をクリックしてウィザードに戻ることができます。
[次へ] をクリックします。
[テーブルの種類の指定] ページで、vTargetMail の [ケース] 列の [チェック] ボックスを選択してケース テーブルとして使用し、[次へ] をクリックします。 ProspectiveBuyer テーブルは後でテストに使用するので、ここでは無視します。
[ トレーニング データの指定] ページで、モデルの予測可能列、キー列、および入力列を少なくとも 1 つ識別します。 [BikeBuyer] 行の [予測可能] 列の [チェック] ボックスを選択します。
注意
ウィンドウの下部に表示される警告に注意してください。 少なくとも 1 つの 入力 列と 1 つの 予測可能列 を選択するまで、次のページに移動することはできません。
[ 提案 ] をクリックして、[ 関連列の提案 ] ダイアログ ボックスを開きます。
[ 提案 ] ボタンは、少なくとも 1 つの予測可能な属性が選択されるたびに有効になります。 [ 関連列の提案 ] ダイアログ ボックスには、予測可能な列に最も密接に関連する列が一覧表示され、予測可能な属性との関連付けによって属性が並べ替えられます。 相関性の高い列 (信頼スコアが 95% を超えている場合) は、モデルに追加する対象として自動的に選択されます。
提案を確認し、[ キャンセル ] をクリックして提案を調整します。
注意
[OK] をクリックすると、一覧表示されているすべての候補がウィザードの入力列としてマークされます。 提示内容の一部のみを使用する場合、値を手動で変更する必要があります。
[キー] 列の [チェック] ボックスが [CustomerKey] 行で選択されていることを確認します。
注意
データ ソース ビューのソース テーブルにキーが表示されていれば、その列がモデルのキーとして自動的に選択されます。
次の行の [入力] 列のチェック ボックスを選択します。 複数の列をオンにするには、セルの範囲を強調表示し、<localizedText>Ctrl</localizedText> キーを押しながらチェック ボックスをオンにします。
Age
CommuteDistance
EnglishEducation
EnglishOccupation
Gender
GeographyKey
HouseOwnerFlag
MaritalStatus
NumberCarsOwned
NumberChildrenAtHome
[リージョン]
TotalChildren
YearlyIncome
ページの左端の列で、次の行のチェック ボックスをオンにします。
AddressLine1
AddressLine2
DateFirstPurchase
EmailAddress
FirstName
LastName
上記の行の左の列のみがオンになっていることを確認します。 これらの列は構造に追加されますが、モデルには追加されません。 ただし、モデル作成後は、ドリルスルーやテストに使用できるようになります。 ドリルスルーの詳細については、「ドリルスルー クエリ (データ マイニング)」を参照してください。
[次へ] をクリックします。
このレッスンの次の作業
データ型およびコンテンツの種類の指定 (基本的なデータ マイニング チュートリアル)
参照
[テーブルの種類の指定] (データ マイニング ウィザード)
Data Mining Designer
Microsoft デシジョン ツリー アルゴリズム