共用方式為


瀏覽群集模型 (基本資料採礦教學課程)

 

適用於: SQL Server 2016 Preview

Microsoft 群集演算法會將案例分成包含類似特性的群集。 這些群集對於瀏覽資料、識別資料的異常及建立預測很有幫助。

Microsoft 叢集檢視器會提供下列索引標籤,用來瀏覽叢集採礦模型:

群集圖表

叢集設定檔

群集特性

群集辨識

[群集圖表] 索引標籤

[群集圖表] 索引標籤會顯示採礦模型中的所有群集。 群集之間的線代表「相似程度」,並根據群集的相似程度加上陰影。 每一個群集的實際色彩各代表變數的頻率和群集中的狀態。

若要在群集圖表索引標籤中瀏覽模型

  1. 使用 採礦模型 清單頂端的 採礦模型檢視器 索引標籤切換至 TM_Clustering 模型。

  2. 檢視器 清單中,選取 Microsoft 群集檢視器

  3. 陰影變數 方塊中,選取 Bike Buyer

    預設變數是 母體擴展, ,但您可以在模型中,以探索哪些群集包含具有您想要的屬性成員的任何屬性變更。

  4. 選取 1狀態 方塊來瀏覽這種情況下,已購買自行車。

    密度 圖例說明陰影變數] 和 [狀態中所選取之屬性狀態配對的密度。 在此範例告訴我們 clusterwith 最暗陰影具有最高百分比的自行車買主。

  5. 將滑鼠暫停在最深陰影的群集上方。

    工具提示會顯示具有屬性的案例百分比 Bike Buyer = 1

  6. 選取有最高的密度,以滑鼠右鍵按一下叢集,請選取叢集 重新命名群集 和型別 Bike Buyers High 以便日後識別。 按一下 [確定] 。

  7. 尋找具有最淺陰影 (和最低密度) 的群集。 以滑鼠右鍵按一下叢集,請選取 重新命名群集 和型別 Bike Buyers Low。 按一下 [確定] 。

  8. 按一下 [ Bike Buyers High 叢集,並將它拖曳到窗格可讓您清楚檢視它與其他群集的連接的區域。

    當您選取群集時,將此群集連接至其他群集的線條會反白顯示,如此您就可以輕鬆看見這個群集的所有關聯性。 當未選取此群集時,您可以透過線條的明暗度來區分圖表中所有群集之間關聯性的強烈程度。 如果陰影很淡或不存在,則表示群集不太相似。

  9. 利用網路左側的滑動軸,可以篩選掉較弱的連結,並找出關聯性最近的群集。 Adventure Works Cycles 行銷部門在判斷傳遞目標郵件的最佳方法時,可能會想要將類似的群集結合在一起。

回到頁首

[群集設定檔] 索引標籤

群集設定檔 ] 索引標籤所提供的整體檢視 TM_Clustering 模型。 群集設定檔 ] 索引標籤包含每個叢集模型中的資料行。 第一個資料行列出至少與一個群集相關聯的變數。 檢視器的其餘部份含有每一個群集的變數,其狀態的分佈情形。 分隔變數的分佈會顯示成橫條圖中顯示的最大數目的彩色列 長條圖列 清單。 連續變數是以鑽石圖顯示,代表在每一個群集中的平均與標準差。

若要在群集設定檔索引標籤中瀏覽模型

  1. 設定 長條圖5

    在我們的模型中,5 是任何一個變數的最大狀態數。

  2. 如果 採礦圖例 封鎖的顯示 屬性設定檔, ,將它移開。

  3. 選取 Bike Buyers High 資料行並將它拖曳至右邊的 母體擴展 資料行。

  4. 選取 Bike Buyers Low 資料行並將它拖曳至右邊的 Bike Buyers High 資料行。

  5. 按一下 [ Bike Buyers High 資料行。

    變數 該群集的重要性的方式排序資料行。 捲動資料行,並檢閱 Bike Buyer High 群集的特性。 例如,它們可能會有比較短的通勤距離。

  6. 按兩下 時代 格中 Bike Buyers High 資料行。

    採礦圖例 顯示更詳細檢視,您會看到這些客戶,以及平均年齡的年齡範圍。

  7. 以滑鼠右鍵按一下 Bike Buyers Low 資料行,然後選取 隱藏資料行

回到頁首

[群集特性] 索引標籤

使用 群集特性 索引標籤上,您可以更詳細地檢查組成群集的特性。 您可以一次瀏覽一個群集,而不是比較所有群集的特性 (如同 [群集設定檔] 索引標籤上的處理方式)。 例如,如果您選取 Bike Buyers High叢集 ] 清單中,您可以看到這個群集中客戶的特性。 雖然這個顯示與 [群集設定檔] 檢視器不同,但是找到的結果是相同的。

注意


除非您設定的初始值 holdoutseed, ,結果就會有所不同每次當您處理模型。 如需詳細資訊,請參閱 HoldoutSeed 元素

回到頁首

[群集辨識] 索引標籤

使用 群集辨識 索引標籤上,您可以瀏覽區分群集的特性。 選取兩個群集,從之後 Cluster 1 ] 清單中,而另一個來自 Cluster 2 ] 清單中,檢視器會計算群集之間的差異,並顯示最能區分群集的屬性清單。

若要在群集辨識索引標籤中瀏覽模型

  1. Cluster 1 方塊中,選取 Bike Buyers High

  2. Cluster 2 方塊中,選取 Bike Buyers Low

  3. 按一下 [ 變數 依字母順序排序。

    某些更重大的差異,在客戶間 Bike Buyers LowBike Buyers High 叢集包含年齡、 是否擁有汽車、 小孩人數及區域。

相關工作

請參閱下列主題,瀏覽其他採礦模型。

本課程的下一項工作

瀏覽貝氏機率分類模型 & #40。基本資料採礦教學課程 )

本課程的前一項工作

瀏覽決策樹模型 & #40。基本資料採礦教學課程 )

另請參閱

使用 Microsoft 叢集檢視器瀏覽模型
叢集辨識索引標籤 (採礦模型檢視器)
叢集設定檔索引標籤 (採礦模型檢視器)
叢集特性索引標籤 (採礦模型檢視器)
叢集圖表索引標籤 (採礦模型檢視器)