共用方式為


探索時序群集模型 (資料採礦教學課程)

您已建立了 [時序群集] 模型,現在,您可以利用資料採礦設計師之 [採礦模型檢視器] 索引標籤中的 Microsoft 時序群集檢視器來探索它。Microsoft 時序群集檢視器有五個索引標籤:[群集圖表][群集設定檔][群集特性][群集辨識][狀態轉換]。如需有關如何使用這個檢視器的詳細資訊,請參閱<以 Microsoft 時序群集檢視器檢視採礦模型>。

[群集圖表] 索引標籤

[群集圖表] 索引標籤會以圖形方式來顯示演算法在資料庫中找到的群集。圖表的配置代表群集的關聯性,類似的群集會緊密地聚集在一起。依預設,節點顏色的陰影代表群集中所有案例的密度,節點愈暗,所包含的案例愈多。您可以變更節點陰影的意義,使它代表屬性和狀態。例如,在 [陰影變數] 清單中選取 [模型],在 [狀態] 清單中選取 [Cycling Cap]。群集圖表顯示群集 9 所包含的 Cycling Cap 密度最高。

[群集設定檔] 索引標籤

[群集設定檔] 索引標籤會顯示各群集內的序列。群集列在 [狀態] 資料行右側的個別資料行中。

在檢視器中,[Model.samples] 資料列代表序列資料,[模型] 資料列代表項目在群集中的整體分佈情況。[Model.samples] 資料列每個資料格中的每個彩色序列行,都代表在群集中隨機選取之使用者的行為。個別序列長條圖中的每個顏色都代表一個產品型號。

例如,群集 3 中的水綠色代表 Mountain-200 自行車。它會呈現為大部份序列中的第一個顏色,表示客戶很可能先將 Mountain-200 自行車放在購物籃中。

[群集特性] 索引標籤

[群集特性] 索引標籤彙總群集各狀態之間的轉換,各個列用來描述所選群集之屬性值的重要性。例如,在 [群集 10] 中,最重要的設定檔之一,是客戶傾向於先將 ML Mountain 輪胎放在他們的購物籃中。

[群集辨識] 索引標籤

您可以利用 [群集辨識] 索引標籤來比較兩個群集,以判斷哪些模型偏好哪些群集。這個索引標籤包含四個資料行:[變數][值][群集 1][群集 2]。如果群集偏好特定模型,在 [變數] 資料行中之對應模型的資料列中,[群集 1][群集 2] 資料行會有一道藍線。藍線愈長,就表示這個模型愈偏好這個群集。

例如,利用檢視器的 [群集辨識] 索引標籤,在 [群集 2] 中選取 [群集 5],在 [群集 1] 中選取 [群集 2],來比較 [群集 2] 和 [群集 5]。購買登山自行車水壺套的客戶,如 [值] 資料行中的 [Mountain Bottle Cage] 所指示,比較可能在 [群集 5] 中,購買旅遊輪胎的客戶,如 [值] 資料行中的 [Touring Tire] 所指示,比較可能分組在 [群集 2] 中。

[狀態轉換] 索引標籤

[狀態轉換] 索引標籤中,您可以選取一個群集來瀏覽它的狀態轉換。每個節點都代表一個模型的狀態,如 Mountain-200。線條代表狀態之間的轉換,每個節點都以轉換的機率為基礎。背景顏色代表群集中的節點頻率。

例如,從 [群集] 中選取 [群集 3],選取 [Touring-3000] 節點,再將 [所有連結] 滑動軸降低幾個空格。您可以在檢視器看出,如果客戶將 Touring Tire 加入購物籃中,如籃色箭頭所指示,客戶接著將 Touring Tire Tube 放到籃中的機率是 0.63,客戶也會將 Sport 100 自行車放入購物籃的機率是 0.26。