絞り込みメール配信マイニング モデル構造の作成 (基本的なデータ マイニング チュートリアル)
絞り込みメール配信シナリオを作成するには、まず、SQL Server データ ツール (SSDT) のデータ マイニング ウィザードを使用して、新しいマイニング構造とデシジョン ツリー マイニング モデルを作成します。
ここでは、新しいマイニング構造を設定し、Microsoft デシジョン ツリー アルゴリズムに基づく初期マイニング モデルを追加します。マイニング構造を作成するには、まずテーブルとビューを選択し、トレーニングに使用する列とテストに使用する列を特定します。
絞り込みメール配信シナリオ用のマイニング構造を作成するには
ソリューション エクスプローラーで [マイニング構造] を右クリックし、[新しいマイニング構造] をクリックして、データ マイニング ウィザードを起動します。
[データ マイニング ウィザードへようこそ] ページで [次へ] をクリックします。
[定義方法の選択] ページで [既存のリレーショナル データベースまたはデータ ウェアハウスを使用する] が選択されていることを確認し、[次へ] をクリックします。
[データ マイニング構造の作成] ページの [使用するデータ マイニング技法を指定してください] で [Microsoft デシジョン ツリー] を選択します。
注 データ マイニング アルゴリズムが見つからないという警告が発生する場合は、プロジェクトのプロパティが適切に構成されていない可能性があります。 この警告は、プロジェクトが Analysis Services サーバーからデータ マイニング アルゴリズムの一覧を取得しようとして、サーバーが見つからない場合に発生します。 既定では、SQL Server Data Tools は localhost をサーバーとして使用します。 別のインスタンスまたは名前付きインスタンスを使用している場合は、プロジェクトのプロパティを変更する必要があります。 詳細については、「Analysis Services プロジェクトの作成 (基本的なデータ マイニング チュートリアル)」を参照してください。
[次へ] をクリックします。
[データ ソース ビューの選択] ページの [使用できるデータ ソース ビュー] ペインで、[Targeted Mailing] を選択します。 [参照] をクリックするとデータ ソース ビューのテーブルが表示され、[閉じる] をクリックするとウィザードに戻ります。
[次へ] をクリックします。
[テーブルの種類の指定] ページで、vTargetMail の [ケース] 列のチェック ボックスをオンにしてこのテーブルがケース テーブルとして使用されるように指定し、[次へ] をクリックします。 ProspectiveBuyer テーブルは後でテストに使用するので、ここでは無視します。
[トレーニング データの指定] ページでは、モデルに対して、予測可能列、キー列、および入力列をそれぞれ 1 つ以上特定します。 [BikeBuyer] 行の [予測可能] 列のチェック ボックスをオンにします。
注 ウィンドウの下部に表示される警告に注意してください。 [入力] 列と [予測可能] 列をそれぞれ 1 つ以上選択しないと、次のページに進めません。
[候補検索] をクリックすると、[関連列の提示] ダイアログ ボックスが開きます。
予測可能属性が 1 つでも選択されていると、[候補検索] ボタンが有効になります。 [関連列の提示] ダイアログ ボックスには、予測可能列に最も関連性の高い列が一覧表示されます。属性が表示される順序は、予測可能属性との相関関係が深い順です。 相関性の高い列 (信頼スコアが 95% を超えている場合) は、モデルに追加する対象として自動的に選択されます。
提示された内容を確認し、無視する場合は [キャンセル] をクリックします。
注 [OK] をクリックすると、すべての提示内容がウィザードで入力列としてマークされます。 提示内容の一部のみを使用する場合、値を手動で変更する必要があります。
[CustomerKey] 行で、[キー] 列のチェック ボックスがオンになっていることを確認します。
注 データ ソース ビューのソース テーブルにキーが表示されていれば、その列がモデルのキーとして自動的に選択されます。
次に示す行で [入力] 列のチェック ボックスをオンにします。 複数の列をオンにするには、セルの範囲を強調表示し、Ctrl キーを押しながらチェック ボックスをオンにします。
Age
CommuteDistance
EnglishEducation
EnglishOccupation
Gender
GeographyKey
HouseOwnerFlag
MaritalStatus
NumberCarsOwned
NumberChildrenAtHome
Region
TotalChildren
YearlyIncome
ページの左端の列で、次の行のチェック ボックスをオンにします。
AddressLine1
AddressLine2
DateFirstPurchase
EmailAddress
FirstName
LastName
上記の行の左の列のみがオンになっていることを確認します。 これらの列は構造に追加されますが、モデルには追加されません。 ただし、モデル作成後は、ドリルスルーやテストに使用できるようになります。 ドリルスルーの詳細については、「ドリルスルー クエリ (データ マイニング)」を参照してください。
[次へ] をクリックします。
このレッスンの次の作業
データ型およびコンテンツの種類の指定 (基本的なデータ マイニング チュートリアル)
関連項目
参照
[テーブルの種類の指定] (データ マイニング ウィザード)