シーケンス クラスター マイニング モデル構造の作成 (中級者向けデータ マイニング チュートリアル)
シーケンス クラスタリング マイニング モデルを作成する最初の手順は、データ マイニング ウィザードを使用して、Microsoft シーケンス クラスタリング アルゴリズムに基づいて新しいマイニング構造とマイニング モデルを作成することです。
マーケット バスケット分析に使用したものと同じデータ ソース ビューを使用しますが、sequence
ID を格納する列を追加します。 このシナリオでは、シーケンスは、顧客が品目を買い物かごに追加した順序を表します。
統計データによって顧客を分類するためにいずれかのモデルで使用する列も追加します。
シーケンス クラスターの構造とモデルを作成するには
SQL Server Data Tools (SSDT) のソリューション エクスプローラーで、[マイニング構造] を右クリックし、[新しいマイニング構造] を選択します。
[データ マイニング ウィザードへようこそ] ページで [次へ]をクリックします。
[ 定義方法の選択] ページで、[ 既存のリレーショナル データベースまたはデータ ウェアハウスから ] が選択されていることを確認し、[ 次へ] をクリックします。
[ データ マイニング構造の作成 ] ページで、[ マイニング モデルを使用してマイニング構造を作成 する] オプションが選択されていることを確認します。 次に、[ 使用するデータ マイニング手法] オプションのドロップダウン リストをクリックし、[ Microsoft シーケンス クラスタリング] を選択します。 [次へ] をクリックします。
[ データ ソース ビューの選択] ページが表示されます。 [ 使用可能なデータ ソース ビュー] で、 を選択します
Orders
。Orders は、マーケット バスケット シナリオで使用したものと同じデータ ソース ビューです。 このデータ ソース ビューを作成していない場合は、「 入れ子になったテーブルを含むデータ ソース ビューの追加 (中間データ マイニング チュートリアル)」を参照してください。
[次へ] をクリックします。
[テーブルの種類の指定] ページで、vAssocSeqOrders テーブルの横にある [Case チェック] ボックスを選択し、vAssocSeqLineItems テーブルの横にある [入れ子になったチェック] ボックスを選択します。 [次へ] をクリックします。
Note
[ケース] ボックスまたは [入れ子になったチェック] ボックスを選択したときにエラーが発生した場合は、データ ソース ビューの結合が正しくない可能性があります。 入れ子になったテーブル vAssocSeqLineItems は、多対一結合によってケース テーブル vAssocSeqOrders に接続されている必要があります。 結合線を右クリックして結合の方向を逆向きにすることによって、リレーションシップを編集できます。 詳細については、「 リレーションシップの作成または編集ダイアログ ボックス (Analysis Services - 多次元データ)」を参照してください。
[トレーニング データの指定] ページで、次のように [チェック] ボックスを選択して、モデルで使用する列を選択します。
IncomeGroup[入力チェック] ボックスを選択します。
この列には、クラスタリングに使用できる、顧客に関する有用な情報が格納されます。 最初のモデルではこの情報を使用し、2 番目のモデルではこの情報を無視します。
OrderNumber
Key
[チェック] ボックスを選択します。このフィールドは、ケース テーブルの識別子、つまり
Key
として使用されます。 一般に、キーにはクラスタリングに適さない一意の値が格納されるので、ケース テーブルのキー フィールドは入力として使用しないでください。地域[入力チェック] ボックスを選択します。
この列には、クラスタリングに使用できる、顧客に関する有用な情報が格納されます。 最初のモデルではこの情報を使用し、2 番目のモデルではこの情報を無視します。
LineNumber[入力]
Key
ボックスと [入力チェック] ボックスを選択します。LineNumber フィールドは、入れ子になったテーブル
Sequence Key
または の識別子として使用されます。 入れ子になったテーブルのキーは、常に入力に使用する必要があります。モデル[入力] ボックスと [予測可能なチェック] ボックスを選択します。
選択内容が正しいことを確認し、[ 次へ] をクリックします。
[ 列のコンテンツとデータ型の指定] ページで、次の表に示す列、コンテンツ タイプ、およびデータ型がグリッドに含まれていることを確認し、[ 次へ] をクリックします。
テーブルまたは列 コンテンツ タイプ データ型 IncomeGroup 離散 Text OrderNumber キー Text リージョン 離散 Text vAssocSeqLineItems Line Number Key Sequence Long モデル 離散 Text [ テスト セットの作成 ] ページで、[テスト のデータの割合 ] を 20 に変更し、[ 次へ] をクリックします。
[ ウィザードの完了 ] ページで、[ マイニング構造名] に「」と入力します
Sequence Clustering with Region
。[ マイニング モデル名] に「」と入力します
Sequence Clustering with Region
。[ ドリルスルーを許可する ] ボックスをオンにし、[完了] をクリック します。