シーケンスクラスターマイニングモデル構造の作成 (中級者向けデータマイニングチュートリアル)

[アーティクル]
03/06/2017

シーケンスクラスタリングマイニングモデルを作成する最初の手順は、データマイニングウィザードを使用して、Microsoft シーケンスクラスタリングアルゴリズムに基づいて新しいマイニング構造とマイニングモデルを作成することです。

マーケットバスケット分析に使用したものと同じデータソースビューを使用しますが、sequence ID を格納する列を追加します。このシナリオでは、シーケンスは、顧客が品目を買い物かごに追加した順序を表します。

統計データによって顧客を分類するためにいずれかのモデルで使用する列も追加します。

シーケンスクラスターの構造とモデルを作成するには

SQL Server Data Tools (SSDT) のソリューションエクスプローラーで、[マイニング構造] を右クリックし、[新しいマイニング構造] を選択します。
[データマイニングウィザードへようこそ] ページで [次へ]をクリックします。
[ 定義方法の選択] ページで、[ 既存のリレーショナルデータベースまたはデータウェアハウスから ] が選択されていることを確認し、[ 次へ] をクリックします。
[ データマイニング構造の作成 ] ページで、[ マイニングモデルを使用してマイニング構造を作成 する] オプションが選択されていることを確認します。次に、[ 使用するデータマイニング手法] オプションのドロップダウンリストをクリックし、[ Microsoft シーケンスクラスタリング] を選択します。 [次へ] をクリックします。

[ データソースビューの選択] ページが表示されます。 [ 使用可能なデータソースビュー] で、を選択します Orders。

Orders は、マーケットバスケットシナリオで使用したものと同じデータソースビューです。このデータソースビューを作成していない場合は、「入れ子になったテーブルを含むデータソースビューの追加 (中間データマイニングチュートリアル)」を参照してください。
[次へ] をクリックします。
[テーブルの種類の指定] ページで、vAssocSeqOrders テーブルの横にある [Case チェック] ボックスを選択し、vAssocSeqLineItems テーブルの横にある [入れ子になったチェック] ボックスを選択します。 [次へ] をクリックします。

Note

[ケース] ボックスまたは [入れ子になったチェック] ボックスを選択したときにエラーが発生した場合は、データソースビューの結合が正しくない可能性があります。入れ子になったテーブル vAssocSeqLineItems は、多対一結合によってケーステーブル vAssocSeqOrders に接続されている必要があります。結合線を右クリックして結合の方向を逆向きにすることによって、リレーションシップを編集できます。詳細については、「リレーションシップの作成または編集ダイアログボックス (Analysis Services - 多次元データ)」を参照してください。
[トレーニングデータの指定] ページで、次のように [チェック] ボックスを選択して、モデルで使用する列を選択します。
- IncomeGroup[入力チェック] ボックスを選択します。
  
  この列には、クラスタリングに使用できる、顧客に関する有用な情報が格納されます。最初のモデルではこの情報を使用し、2 番目のモデルではこの情報を無視します。
- OrderNumberKey [チェック] ボックスを選択します。
  
  このフィールドは、ケーステーブルの識別子、つまり Key として使用されます。一般に、キーにはクラスタリングに適さない一意の値が格納されるので、ケーステーブルのキーフィールドは入力として使用しないでください。
- 地域[入力チェック] ボックスを選択します。
  
  この列には、クラスタリングに使用できる、顧客に関する有用な情報が格納されます。最初のモデルではこの情報を使用し、2 番目のモデルではこの情報を無視します。
- LineNumber[入力] Key ボックスと [入力チェック] ボックスを選択します。
  
  LineNumber フィールドは、入れ子になったテーブルSequence Keyまたはの識別子として使用されます。入れ子になったテーブルのキーは、常に入力に使用する必要があります。
- モデル[入力] ボックスと [予測可能なチェック] ボックスを選択します。
選択内容が正しいことを確認し、[ 次へ] をクリックします。

[ 列のコンテンツとデータ型の指定] ページで、次の表に示す列、コンテンツタイプ、およびデータ型がグリッドに含まれていることを確認し、[ 次へ] をクリックします。

テーブルまたは列	コンテンツタイプ	データ型
IncomeGroup	離散	Text
OrderNumber	キー	Text
リージョン	離散	Text
vAssocSeqLineItems
Line Number	Key Sequence	Long
モデル	離散	Text

[ テストセットの作成 ] ページで、[テスト のデータの割合 ] を 20 に変更し、[ 次へ] をクリックします。
[ ウィザードの完了 ] ページで、[ マイニング構造名] に「」と入力します Sequence Clustering with Region。
[ マイニングモデル名] に「」と入力します Sequence Clustering with Region。
[ ドリルスルーを許可する ] ボックスをオンにし、[完了] をクリック します。

このレッスンの次の作業

シーケンスクラスターモデルの処理

参照

Data Mining Designer
Microsoft シーケンスクラスタリングアルゴリズム

次の方法で共有

シーケンスクラスターマイニングモデル構造の作成 (中級者向けデータマイニングチュートリアル)

シーケンスクラスターの構造とモデルを作成するには

このレッスンの次の作業

参照

その他のリソース

次の方法で共有

シーケンス クラスター マイニング モデル構造の作成 (中級者向けデータ マイニング チュートリアル)

シーケンス クラスターの構造とモデルを作成するには

このレッスンの次の作業

参照

その他のリソース

シーケンスクラスターマイニングモデル構造の作成 (中級者向けデータマイニングチュートリアル)

シーケンスクラスターの構造とモデルを作成するには