共用方式為


探索購物籃模型 (資料採礦教學課程)

更新: 2007 年 9 月 15 日

您已建立了 [關聯] 模型,現在,您可以利用資料採礦設計師 [採礦模型檢視器] 索引標籤中的 Microsoft 關聯檢視器來探索它。當您探索模型時,可以很容易看出哪些產品比較可能一起出現,從而找出項目之間的關聯性。您也可以篩除關聯較弱的部分,然後浮現模式的大致構想。

Microsoft 關聯檢視器有三個索引標籤: [項目集][規則][相依性網路]。如需有關這個檢視器的詳細資訊,請參閱<以 Microsoft 關聯規則檢視器檢視採礦模型>。

[項目集] 索引標籤

[項目集] 索引標籤會顯示 Microsoft 關聯分析演算法所發現之項目集的三項重要相關資訊:案例數、大小,以及項目集的實際構成。「案例數」是這個項目集出現在其中的交易數,「大小」是項目集中的項目數。演算法可以產生大量的項目集,這會隨著演算法參數的設定方式而不同。您可以利用在 [項目集] 索引標籤頂端的控制項來篩選檢視器,讓它只顯示包含指定的最小支援和項目集大小的項目集。

您也可以利用 [篩選項目集] 方塊來篩選檢視器所顯示的項目集。例如,如果只要查看包含 Mountain-200 自行車相關資訊的項目集,請在 [篩選項目集] 中,輸入 [Mountain-200]。您可以從檢視器中看出,它只會顯示含有 "Mountain-200" 等單字的項目集。在檢視器中傳回的每個項目集都含有銷售了 Mountain-200 自行車的相關交易資訊。例如,[案例數] 資料行含有 710 值的項目集指出,在所有交易中,共有 710 個人既購買了 Mountain-200 自行車,也購買了 Sport-100 自行車。

[規則] 索引標籤

[規則] 索引標籤會顯示演算法所找出之規則的下列相關資訊。

  • 機率
    規則出現的可能性。
  • 重要性
    規則效益的量值;值愈高,規則愈好。只看機率可能會誤導。例如,如果每項交易都包含 x 項目,y 規則預測 x 的機率是 1,這表示 x 一律會出現。此時即使規則的精確度非常好,它也無法轉送非常多資訊,因為不論 y 如何,每項交易都包含 x
  • 規則
    規則的定義。

如同 [項目集] 索引標籤,您可以篩選規則,只顯示最有用的規則。例如,如果您只要看到包含 Mountain-200 自行車的規則,請在 [篩選規則] 方塊中,輸入 [Mountain-200]。之後,檢視器只會顯示包含 "Mountain-200" 單字的規則。每項規則都可用來根據其他項目的出現情況,預測這個項目在交易中的出現狀況。例如,第一個規則告訴您當有人購買 Mountain-200 自行車和水壺時,這個人也購買 Mountain 水壺套的機率是 1。

[相依性網路] 索引標籤

您可以利用 [相依性網路] 索引標籤來探索模型中不同項目的互動。檢視器中的每個節點都代表一個項目;例如,Mountain-200 = 現有的節點指出某項交易中有 Mountain-200。您可以選取一個節點,利用索引標籤底端的彩色圖例來判斷哪些其他項目決定了模型中的其他項目,或模型中的其他項目決定了它們。

滑動軸與規則的機率相關。請向上或向下移動滑動軸來篩選微弱關聯。例如,在 [顯示] 方塊中,選取 [只顯示屬性名稱],再按一下 [Mountain Bottle Cage] 節點。此時檢視器會指出 Mountain 水壺套會預測水壺和 Mountain-200 自行車的銷售情況,水壺和 Mountain-200 自行車也會預測 Mountain 水壺套的銷售情況。這表示這些項目很可能同時出現在單一交易中。換言之,如果客戶購買了自行車,他也可能購買水壺套和水壺。

下一課

第 5 課:建立時序群集狀況