シーケンス クラスタ モデルの検証 (データ マイニング チュートリアル)
前の実習では Sequence Clustering モデルを作成しました。次は、データ マイニング デザイナの [マイニング モデル ビューア] タブを開き、Microsoft シーケンス クラスタ ビューアを使用してこのモデルを検証します。Microsoft シーケンス クラスタ ビューアには、[クラスタ ダイアグラム]、[クラスタのプロファイル]、[クラスタの特性]、[クラスタの識別]、[状態遷移] という 5 つのタブがあります。このビューアの使用法の詳細については、「Microsoft シーケンス クラスタ ビューアを使用したマイニング モデルの表示」を参照してください。
[クラスタ ダイアグラム] タブ
[クラスタ ダイアグラム] タブには、アルゴリズムによりデータベースから検出されたクラスタがグラフィカルに表示されます。ダイアグラムのレイアウトは、類似するクラスタを緊密にグループ化したクラスタのリレーションシップを表します。既定では、ノードの色の濃さはクラスタに存在する件数の密度を表し、ノード色が濃くなるほど多数の件数が存在することになります。ノードの色の濃さが属性や状態を表すように、設定を変更することもできます。たとえば、[シェーディング変数] ボックスの一覧で [Model] を選択し、[状態] ボックスの一覧で [Cycling Cap] を選択します。クラスタ ダイアグラムから、サイクリング キャップの密度がクラスタ 9 で最も高いことがわかります。
[クラスタのプロファイル] タブ
[クラスタのプロファイル] タブには、各クラスタに存在するシーケンスが表示されます。[状態] 列の右側の各列には、クラスタが一覧表示されます。
このビューアの Model.samples 行はシーケンス データを表しています。[Model] 行は、クラスタ内における項目の全体的な分布を表しています。Model.samples 行の各セルに表示されるカラー シーケンスは、そのクラスタでランダムに選択されたユーザーの動向を表します。シーケンス ヒストグラムでは、各製品モデルがそれぞれ異なる色で示されます。
たとえば、クラスタ 3 の水色は、Mountain-200 モデルの自転車を表しています。ほとんどのシーケンスでこの色が 1 番目の色として表示されていることから、顧客が Mountain-200 モデルの自転車を最初に買い物かごに入れる傾向が非常に強いことがわかります。
[クラスタの特性] タブ
[クラスタの特性] タブは、クラスタの状態遷移についてまとめられ、選択したクラスタの属性値の重要度がバーで表示されます。たとえば、クラスタ 10 における最も重要なプロファイルの 1 つは、顧客が ML Mountain タイヤを最初に買い物かごに入れる傾向があるということです。
[クラスタの識別] タブ
[クラスタの識別] タブでは、2 つのクラスタを比較し、どのクラスタでどのようなモデルが好まれているかを判断できます。このタブには、[変数]、[値]、[クラスタ 1]、[クラスタ 2] の 4 つの列があります。いずれかのクラスタで特定のモデルが支持されている場合は、そのモデルに対応する [値] 列の行と、該当するクラスタ列 ([クラスタ 1] または [クラスタ 2]) が交差するセルに青色のバーが表示されます。青色のバーが長いほど、そのクラスタでのモデルの支持率が高くなります。
たとえば、ビューアの [クラスタの識別] タブで、[クラスタ 1] ボックスで [クラスタ 2] を選択し、[クラスタ 2] ボックスで [クラスタ 5] を選択して、クラスタ 2 とクラスタ 5 を比較してみましょう。[値] 列が [Mountain Bottle Cage] である行を見ると、マウンテン バイク用ボトル ケージを購入する顧客はクラスタ 5 に多いことがわかります。また、[値] 列が [Touring Tire] である行を見ると、ツーリング タイヤを購入する顧客はクラスタ 2 に多いことがわかります。
[状態遷移] タブ
[状態遷移] タブでは、クラスタを選択し、その状態の遷移を表示できます。各ノードは、Mountain-200 などのモデルの状態を表します。ある状態からある状態への遷移は 1 本の線で表され、各ノードは遷移の確率に基づいています。背景色は、そのクラスタにおけるノードの出現頻度を表します。
たとえば、[クラスタ] から [クラスタ 3] を選択し、[Touring-3000] ノードを選択して、[すべてのリンク] スライダを数レベル下方に移動します。ビューアに青い矢印で示されるように、顧客がツーリング タイヤを買い物かごに入れた場合、その次にツーリング タイヤ チューブもかごに入れる確率は 0.63、さらに Sport 100 モデル自転車もかごに入れる確率は 0.26 となっています。