Microsoft 時序叢集演算法
Microsoft 時序群集演算法是 Microsoft SQL Server Analysis Services所提供的序列分析演算法。 您可以使用此演算法來探索包含可透過下列路徑或 序列連結之事件的資料。 此演算法會透過分組或群集相同的時序來尋找最常見的時序。 以下是包含可能用於資料採礦之時序的一些資料範例,讓您得以深入了解常見問題或商務案例:
按一下使用者在導覽或瀏覽網站時建立的路徑。
列出某個事故之前之事件的記錄,例如硬碟故障或伺服器死結。
描述客戶在線上零售店將商品放入購物車之順序的交易記錄。
追蹤客戶 (或病人) 在某段期間之互動的記錄,以便預測服務取消或其他不好的結果。
此演算法在許多方面與 Microsoft 叢集演算法類似。 不過,Microsoft 時序群集演算法會尋找包含類似路徑的案例叢集,而不是尋找包含類似屬性的案例叢集。
範例
Adventure Works Cycles 網站會收集使用者流覽的頁面資訊,以及頁面流覽順序的相關資訊。 因為該公司提供線上訂購,客戶必須登入站台。 這樣為公司提供每一個客戶設定檔的點選資訊。 透過在此資料上使用 Microsoft 時序群集演算法,公司可以尋找具有類似模式或點選順序的客戶群組或叢集。 然後,公司可以使用這些群集來分析使用者在整個網站的移動情形、識別哪些頁面與某項特定產品最有關係,並預測下次最可能再造訪哪些頁面。
演算法的運作方式
Microsoft 時序群集演算法是一種混合式演算法,結合了群集技術與 Markov 鏈結分析,以識別叢集及其序列。 Microsoft 時序群集演算法的其中一個標記是使用時序資料。 這項資料通常代表資料集內的一系列事件或各狀態之間的轉換,例如特定使用者的一系列產品採購或網頁點選。 此演算法會檢查所有轉換的機率並測量資料集內所有可能時序之間的差異或距離,以便判斷哪些時序最適合當做群集的輸入使用。 在此演算法已經建立候選時序的清單之後,它就會使用此時序資訊當做群集之 EM 方法的輸入。
如需實作的詳細說明,請參閱< Microsoft Sequence Clustering Algorithm Technical Reference>。
時序叢集模型所需的資料
當您準備資料以供定型時序叢集模型使用時,應該要了解特定演算法的需求,包括所需的資料量以及資料的使用方式。
時序叢集模型的需求如下:
單一索引鍵資料行 :時序叢集模型需要可識別記錄的索引鍵。
序列資料行 針對時序資料,模型必須具有包含序列識別碼資料行的巢狀資料表。 此時序識別碼可以是任何可排序資料類型。 例如,您可以使用網頁識別碼、整數或文字字串,只要資料行可識別時序中的事件即可。 每個時序只能有一個時序識別碼,而且每個模型只能有一種時序。
選擇性非時序屬性 :此演算法支援加入與時序無關的其他屬性。 這些屬性可以包含巢狀資料行。
例如,在稍早的 Adventure Works Cycles 網站中,時序群集模型可能包含訂單資訊做為案例資料表、每個訂單的特定客戶人口統計資料做為非順序屬性,以及巢狀資料表,其中包含客戶流覽網站或將專案放入購物車中做為順序資訊的巢狀資料表。
如需時序叢集模型所支援內容類型和資料類型的詳細資訊,請參閱 Microsoft 時序叢集演算法技術參考的<需求>一節。
檢視時序叢集模型
此演算法所建立的採礦模型會包含資料中最常見時序的描述。 若要瀏覽此模型,您可以使用 [Microsoft 時序群集檢視器]。 當您檢視時序群集模型時,Analysis Services 會顯示包含多個轉換的叢集。 您也可以檢視相關的統計資料。 如需詳細資訊,請參閱 使用 Microsoft 時序叢集檢視器瀏覽模型。
如果您想要知道更多詳細資訊,您可以在 Microsoft 一般內容樹狀檢視器中瀏覽此模型。 針對此模型所儲存的內容包括每個節點中所有值的分佈、每個群集的機率,以及有關轉換的詳細資料。 如需詳細資訊,請參閱 Sequence Clustering Models (Analysis Services - 資料採礦) 的採礦模型內容 。
建立預測
在此模型已定型之後,結果會儲存成一組模式。 您可以使用資料中最常見時序的描述來預測新時序的下一個可能步驟。 不過,因為此演算法包含其他資料行,所以您可以使用產生的模型來識別時序資料與非循序輸入之間的關聯性。 例如,如果您將人口統計資料加入至模型,就可以針對特定客戶群組進行預測。 您可以自訂預測查詢,以便傳回變動數目的預測或傳回描述性統計資料。
如需如何針對資料採礦模型建立查詢的資訊,請參閱 資料採礦查詢。 如需如何在時序叢集模型中使用查詢的範例,請參閱 時序叢集模型查詢範例。
備註
不支援使用預測模型標記語言 (PMML) 來建立採礦模型。
支援鑽研。
支援 OLAP 採礦模型的使用和資料採礦維度的建立。
另請參閱
資料採礦演算法 (Analysis Services - 資料採礦)
Microsoft 時序群集演算法技術參考
時序叢集模型查詢範例
使用 Microsoft 時序叢集檢視器瀏覽模型