共用方式為


Microsoft時序群集演算法

適用於: SQL Server 2019 和舊版 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

SQL Server 2017 Analysis Services 中已淘汰數據採礦,現在已在 SQL Server 2022 Analysis Services 中停止。 檔不會更新為已淘汰和已停止的功能。 若要深入瞭解,請參閱 Analysis Services 回溯相容性

Microsoft時序群集演算法是結合時序分析與群集的唯一演算法。 您可以使用此演算法來探索數據,其中包含可在 序列中連結的事件。 此演算法會尋找最常見的序列,並執行叢集來尋找類似序列。 下列範例說明您可能會擷取為機器學習數據的序列類型,以提供常見問題或商務案例的深入解析:

  • 當使用者瀏覽或瀏覽網站時產生的 Clickstreams 或按兩下路徑

  • 列出事件之前的事件記錄,例如硬碟失敗或伺服器死結

  • 描述客戶將專案新增至在線購物車之訂單的交易記錄

  • 追蹤客戶或患者互動一段時間的記錄,以預測服務取消或其他不良結果

此演算法與Microsoft叢集演算法有許多相似之處。 不過,Microsoft時序群集演算法會尋找包含類似路徑之案例的叢集,而不是尋找包含類似屬性的案例叢集。

Adventure Works Cycles 網站會收集用戶流覽哪些頁面的相關信息,以及瀏覽頁面的順序。 由於公司提供在線訂購,客戶必須登入網站。 這會為公司提供每個客戶配置檔的點選資訊。 藉由在此數據上使用Microsoft時序群集演算法,公司可以尋找具有類似模式或按序的客戶群組或叢集。 然後,公司可以使用這些叢集來分析使用者如何瀏覽網站、識別哪些頁面與特定產品的銷售最緊密相關,以及預測下一次流覽哪些頁面。

演算法的運作方式

Microsoft時序群集演算法是混合式演算法,結合了群集技術與 Markov 鏈結分析,以識別叢集及其序列。 Microsoft時序群集演算法的其中一個標誌是其使用時序數據。 此數據通常代表數據集中狀態之間的一系列事件或轉換,例如特定使用者的一系列產品購買或 Web 點選。 此演算法會檢查所有轉換機率,並測量數據集中所有可能序列之間的差異或距離,以判斷哪一個序列最適合做為群集的輸入。 在演算法建立候選序列清單之後,它會使用時序資訊做為使用預期最大化(EM) 進行叢集的輸入。

如需實作的詳細描述,請參閱 Microsoft 時序群集演算法技術參考

時序群集模型所需的數據

當您準備數據以用於定型時序群集模型時,您應該瞭解特定演算法的需求,包括需要多少數據,以及如何使用數據。

時序叢集模型的需求如下:

  • 單一索引鍵數據行 序列群集模型需要可識別記錄的索引鍵。

  • 序列數據行 序列數據,模型必須有包含時序標識符數據行的巢狀數據表。 序列標識元可以是任何可排序的數據類型。 例如,只要數據行識別序列中的事件,您就可以使用網頁標識碼、整數或文字字串。 每個序列只允許一個序列標識元,而且每個模型中只允許一種類型的序列。

  • 選擇性的非時序屬性 演算法支援新增與排序無關的其他屬性。 這些屬性可以包含巢狀數據行。

例如,在先前的 Adventure Works Cycles 網站範例中,時序群集模型可能包含訂單資訊做為案例數據表、將每個訂單的特定客戶人口統計為非時序屬性,以及包含客戶瀏覽網站或將專案放入購物車做為順序資訊的巢狀數據表。

如需順序群集模型所支援內容類型和數據類型的詳細資訊,請參閱 Microsoft 時序群集演算法技術參考的需求一節。

檢視時序群集模型

此演算法所建立的採礦模型包含數據中最常見序列的描述。 若要探索模型,您可以使用 Microsoft 時序叢集檢視器。 當您檢視時序叢集模型時,SQL Server Analysis Services 會顯示包含多個轉換的叢集。 您也可以檢視相關的統計數據。 如需詳細資訊,請參閱 使用 Microsoft 時序叢集檢視器瀏覽模型

如果您想要深入瞭解,您可以在 Microsoft 一般內容樹視圖中流覽模型。 針對模型儲存的內容包含每個節點中所有值的分佈、每個叢集的機率,以及轉換的詳細數據。 如需詳細資訊,請參閱時序群集模型 採礦模型內容(Analysis Services - 資料採礦)

建立預測

定型模型之後,結果會儲存為一組模式。 您可以使用資料中最常見序列的描述來預測新序列的下一個可能步驟。 不過,因為演算法包含其他數據行,因此您可以使用產生的模型來識別循序數據與非循序輸入之間的關聯性。 例如,如果您將人口統計數據新增至模型,您可以針對特定的客戶群組進行預測。 您可以自定義預測查詢以傳回可變數目的預測,或傳回描述性統計數據。

如需如何針對數據採礦模型建立查詢的詳細資訊,請參閱 數據採礦查詢。 如需如何搭配時序叢集模型使用查詢的範例,請參閱 時序群集模型查詢範例

言論

  • 不支援使用預測模型標記語言 (PMML) 來建立採礦模型。

  • 支援鑽研。

  • 支援使用 OLAP 採礦模型和建立數據採礦維度。

另請參閱

數據採礦演算法 (Analysis Services - 數據採礦)
Microsoft 時序群集演算法技術參考
時序叢集模型查詢範例
使用Microsoft時序叢集查看器流覽模型