次の方法で共有


マーケット バスケット モデルの検証 (データ マイニング チュートリアル)

更新 : 2007 年 9 月 15 日

前の実習では Association モデルを作成しました。次は、データ マイニング デザイナの [マイニング モデル ビューア] を開き、Microsoft アソシエーション ビューアを使用してアソシエーション モデルを検証します。モデルを検証すると、同時に出現する傾向がある製品を簡単に調べられ、アイテム間のリレーションシップを検証できます。さらに、緊密な関係のみを表示し、新しいパターンの全般的概念を調べることができます。

Microsoft アソシエーション ビューアには、[アイテムセット][ルール][依存関係ネットワーク] という 3 つのタブがあります。このビューアの詳細については、「Microsoft アソシエーション ルール ビューアを使用したマイニング モデルの表示」を参照してください。

[アイテムセット] タブ

[アイテムセット] タブには、Microsoft アソシエーション アルゴリズムが検出するアイテムセットに関して、3 つの重要な情報が表示されます。そのアイテムセットが発生する取り引きの数を示す [サポート]、そのアイテムセットに存在するアイテム数を示す [サイズ]、およびそのアイテムセットの実際の構成を示す [アイテムセット] です。アルゴリズム パラメータの設定方法によっては、多数のアイテムセットが生成される場合があります。[アイテムセット] タブの上部のコントロールを使用してビューアにフィルタを適用し、サポートおよびアイテムセットのサイズが指定の (最低限の) 大きさを超えるアイテムセットのみを表示することができます。

また、ビューアに表示するアイテムセットを [アイテムセットのフィルタ] ボックスで制限することもできます。たとえば、Mountain-200 モデルの自転車の情報を持つアイテムセットのみを表示するには、[アイテムセットのフィルタ] に「Mountain-200」と入力します。この場合、"Mountain-200" という語句を含むアイテムセットのみが表示されます。ビューアに返される各アイテムセットには、Mountain-200 が販売された取り引きに関する情報が含まれます。たとえば、[サポート] 列の値が 710 であるアイテムセットは、全取り引きのうち、Mountain-200 モデルの自転車を購入し、さらに Sport-100 モデルの自転車も購入した顧客が 710 人いることを示します。

[ルール] タブ

[ルール] タブには、アルゴリズムの検索ルールに関する次の情報が表示されます。

  • 確率
    ルールが発生する確率値です。
  • 重要度
    ルールの有効性を示します。この値が高いほどルールの有効性が高くなります。確率のみに注目していると誤った判断を招くことがあります。たとえば、すべての取り引きにアイテム x が含まれていると、ルール y は、x の確率が 1 である (まり x が必ず発生する) と予測します。ルールの精度が非常に高くても、y とは無関係にすべての取り引きに x が含まれているため、この確率は信頼性の高い情報とはいえません。
  • ルール
    ルールの定義です。

[アイテムセット] タブと同様、最も注目すべきルールのみを表示するようにルールにフィルタを適用できます。たとえば、Mountain-200 モデルの自転車を含むルールのみを表示するには、[ルールのフィルタ] ボックスに「Mountain-200」と入力します。これにより、"Mountain-200" という語句を含むルールのみがビューアに表示されます。各ルールを使用すると、他のアイテムが存在するかどうかに基づいて、あるアイテムが取り引きに含まれるかどうかを予測することができます。たとえば、最初のルールは、Mountain-200 モデル自転車と水筒を購入した顧客が、マウンテン バイク用ボトル ケージも同時に購入する確率は 1 であることを示しています。

[依存関係ネットワーク] タブ

[依存関係ネットワーク] タブでは、モデル内のさまざまなアイテムの相互関係を検証できます。ビューアの各ノードは商品を表します。たとえば、[Mountain-200 = Existing] ノードは、取り引きに Mountain-200 モデルが存在することを示します。ノードを選択し、タブの下部にある色の凡例を参照することにより、モデル内のどのアイテムが他のアイテムに影響し、また他のどのアイテムに影響されているのかを判断できます。

スライダはルールの確率に関連付けられています。スライダを下方向に移動すると、緊密な関係のみが表示されます。たとえば、[表示] ボックスで [属性名のみ表示] を選択し、[Mountain Bottle Cage] ノードをクリックしてみましょう。マウンテン バイク用ボトル ケージと水筒、およびマウンテン バイク用ボトルケージと Mountain-200 モデル自転車は、互いに予測し、予測される関係にあることがわかります。つまり、これらの商品はまとめて購入される可能性が高いことを示しています。さらに言い換えると、自転車を購入する顧客は、ボトル ケージと水筒も同時に購入する傾向にあります。

次のレッスン

レッスン 5 : シーケンス クラスタ シナリオの作成