瀏覽決策樹模型 (基本資料採礦教學課程)
Microsoft 決策樹演算法會根據定型集中的其餘資料行,預測哪些資料行影響了自行車的購買決策。
Microsoft 決策樹檢視器會提供下列索引標籤,用來瀏覽決策樹採礦模型:
決策樹
相依性網路
下列章節描述如何選取適當的檢視器及瀏覽其他採礦模型。
決策樹索引標籤
在 [決策樹] 索引標籤,您可以檢查組成採礦模型的所有樹狀模型。
由於本教學課程專案中的目標郵寄模型只包含單一可預測屬性 Bike Buyer,因此只有一個樹狀結構可供檢視。如果有多個樹狀結構,您可以使用 [樹狀結構] 方塊來選擇另一個樹狀結構。
在決策樹檢視器中檢閱 TM_Decision_Tree 模型時,可以發現在預測自行車購買行為時,年齡是最重要的一項因素。值得注意的是,當您依年齡將客戶分組時,每一個年齡節點的下一個樹狀分支都不相同。藉由瀏覽決策樹索引標籤,我們可以得到以下結論:年齡在 34 到 40 之間,只有一部車子或沒有車子的購買者非常可能購買自行車。而低於此年齡,住在太平洋地區且只有一部車子或沒有車子的單身客戶也很可能購買自行車。
若要在決策樹索引標籤中瀏覽模型
在 [資料採礦設計師] 中,選取 [採礦模型檢視器] 索引標籤。
依預設,設計師會開啟第一個新增到結構的模型 (在此案例中為 TM_Decision_Tree)。
使用放大鏡按鈕調整樹狀結構顯示大小。
依預設,Microsoft 樹狀檢視器只顯示樹狀結構的前 3 個層級。如果樹狀結構的層級不到 3 個,則檢視器只顯示現有的層級。您可以使用 [顯示層級] 滑動軸或 [預設展開] 清單檢視更多層級。
將 [顯示層級] 滑動到第四個橫條。
將 [背景] 值變更為 1。
藉由變更 [背景] 設定,您可以迅速查看每個節點中目標值為 1 之 [Bike Buyer] 的案例數目。請記住,在這個特定案例中,每個案例都代表一個客戶。1 這個值表示客戶先前有購買自行車,而 0 這個值則表示客戶尚未購買自行車。節點的陰影愈深,表示節點中擁有目標值的案例百分比愈高。
將滑鼠游標放在標示為 [全部] 的節點上方。隨即出現工具提示,顯示下列資訊:
案例總數
非自行車購買者的案例數目
自行車購買者的案例數目
遺漏 [Bike Buyer] 值的案例數目
或者,將滑鼠游標放在樹狀結構其中任何一個節點上方,查看從前一個節點到達該節點所需的條件。您也可以在 [採礦圖例] 中檢視與此相同的資訊。
按一下 [Age >=34 and < 41] 節點。其長條圖會顯示為一個橫跨節點的細長水平橫條,並表示在此年齡範圍中,已購買 (粉紅色) 或未購買 (藍色) 自行車的客戶分佈狀況。檢視器顯示出年齡介於 34 到 40,只有一台車子或沒有車子的客戶有可能購買自行車。再進一步研究,我們可以發現如果客戶年齡落在 38 到 40 歲,購買自行車的可能性又更高。
由於您在建立結構和模型時已啟用鑽研,因此您可以從模型案例和採礦結構中擷取詳細資訊,包括未包含在採礦模型中的資料行 (例如 emailAddress 和 FirstName)。
如需詳細資訊,請參閱<針對採礦模型和採礦結構使用鑽研 (Analysis Services - 資料採礦)>。
若要鑽研案例資料
以滑鼠右鍵按一下節點,然後依序選取 [鑽研] 和 [僅模型資料行]。
各定型案例的詳細資訊會以試算表格式顯示。這些詳細資料來自您在建立採礦結構時,選取為案例資料表的 vTargetMail 檢視。
以滑鼠右鍵按一下節點,然後依序選取 [鑽研] 和 [模型和結構資料行]。
隨即顯示相同的資料表,且結尾附加結構資料行。
回到頁首
相依性網路索引標籤
[相依性網路] 索引標籤能顯示對於採礦模型的預測能力有所幫助的變數之間的關聯性。相依性網路檢視器更加印證我們的發現,也就是在預測自行車購買行為時,年齡和地區是重要的因素。
若要在相依性網路索引標籤中瀏覽模型
按一下 [Bike Buyer] 節點來識別它的相依性。
相依性網路的中央節點 [Bike Buyer] 代表採礦模型中的可預測屬性。粉紅色的陰影表示所有屬性都會影響自行車的購買。
調整 [所有連結] 滑動軸來識別最具影響力的屬性。
隨著您將滑動軸往下移,便只留下對 [Bike Buyer] 資料行影響最大的屬性。藉由調整滑動軸,您可以發現年齡和地區是預測自行車購買者的最大因素。