資料採礦演算法（Analysis Services - 數據採礦）

發行項
07/05/2024

適用於： SQL Server 2019 和舊版 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

SQL Server 2017 Analysis Services 中已淘汰數據採礦，現在已在 SQL Server 2022 Analysis Services 中停止。檔不會更新為已淘汰和已停止的功能。若要深入瞭解，請參閱 Analysis Services 回溯相容性。

數據採礦（或機器學習）中演算法是一組啟發學習法和計算，可從數據建立模型。為了建立模型，演算法會先分析您提供的數據，尋找特定類型的模式或趨勢。此演算法會針對許多反覆專案使用此分析的結果，以尋找建立採礦模型的最佳參數。然後，這些參數會套用到整個數據集，以擷取可採取動作的模式和詳細的統計數據。

演算法從您的數據建立的採礦模型可以採用各種形式，包括：

一組叢集，描述數據集中的案例如何相關。
預測結果的判定樹，並描述不同準則如何影響該結果。
預測銷售額的數學模型。
一組規則，描述產品如何在交易中群組在一起，以及產品一起購買的可能性。

SQL Server 數據採礦中提供的演算法是從數據衍生模式的最受歡迎、研究完善的方法。若要以一個範例為例，K-means 叢集是最舊的叢集演算法之一，而且可在許多不同的工具和許多不同的實作和選項中廣泛取得。不過，SQL Server 數據採礦中使用的 K-means 叢集的特定實作是由 Microsoft Research 所開發，然後針對 SQL Server Analysis Services 的效能進行優化。所有Microsoft數據採礦演算法都可以廣泛自定義，而且使用提供的 API 完全可程式化。您也可以使用 Integration Services 中的數據採礦元件，自動建立、定型和重新定型模型。

您也可以使用符合 OLE DB for Data Mining 規格的第三方演算法，或開發可註冊為服務的自定義演算法，然後在 SQL Server 數據採礦架構中使用。

選擇正確的演算法

選擇最適合用於特定分析工作的演算法可能是一項挑戰。雖然您可以使用不同的演算法來執行相同的商務工作，但每個演算法會產生不同的結果，而某些演算法可能會產生多個類型的結果。例如，您可以不僅使用Microsoft判定樹演算法進行預測，還可以作為減少數據集中數據行數目的方法，因為判定樹可以識別不會影響最終採礦模型的數據行。

依類型選擇演算法

SQL Server 數據採礦包含下列演算法類型：

分類演算法 根據數據集中的其他屬性預測一或多個離散變數。
回歸演算法 根據數據集中的其他屬性預測一或多個連續數值變數，例如收益或損失。
分割演算法 將數據分割成具有類似屬性的專案群組或叢集。
關聯演算法 尋找數據集中不同屬性之間的相互關聯。這種演算法最常見的應用是建立關聯規則，可用於購物籃分析。
時序分析演算法 摘要數據中的頻繁序列或情節，例如網站中的一系列點擊，或機器維護前的一系列記錄事件。

不過，您的解決方案中不應限制為一個演算法。經驗豐富的分析師有時會使用一種演算法來判斷最有效的輸入（也就是變數），然後套用不同的演算法，根據該數據預測特定結果。 SQL Server 數據採礦可讓您在單一採礦結構上建置多個模型，因此在單一數據採礦解決方案中，您可以使用叢集演算法、判定樹模型和貝氏機率模型來取得數據的不同檢視。您也可以在單一解決方案內使用多個演算法來執行個別的工作：例如，您可以使用回歸來取得財務預測，並使用類神經網路演算法來執行影響預測的因素分析。

依工作選擇演算法

為了協助您選取與特定工作搭配使用的演算法，下表提供每個演算法傳統上使用之工作類型的建議。

工作的範例	要使用的Microsoft演算法
預測離散屬性：將潛在買家清單中的客戶標幟為良好或不佳的前景。計算伺服器在未來 6 個月內失敗的機率。分類患者結果並探索相關因素。	Microsoft 判定樹演算法 Microsoft 貝氏機率分類演算法 Microsoft 叢集演算法 Microsoft 類神經網路演算法
預測連續屬性：預測明年的銷售量。根據過去的歷史和季節性趨勢來預測網站訪客。產生給定人口統計的風險分數。	Microsoft 判定樹演算法 Microsoft 時間序列演算法 Microsoft 線性回歸演算法
預測序列：執行公司網站的點擊流分析。分析導致伺服器失敗的因素。擷取和分析門診訪問期間的活動順序，以制定常見活動的最佳作法。	Microsoft 時序群集演算法
尋找交易中常見專案的群組：使用購物籃分析來判斷產品放置。建議客戶購買其他產品。分析訪客到活動的調查數據，以找出哪些活動或展臺相互關聯，以規劃未來的活動。	Microsoft 關聯演算法 Microsoft 判定樹演算法
尋找類似專案的群組：根據人口統計和行為等屬性建立患者風險配置檔群組。流覽和購買模式來分析使用者。識別具有類似使用特性的伺服器。	Microsoft 叢集演算法 Microsoft 時序群集演算法

下一節提供 SQL Server 數據採礦中每個數據採礦演演算法學習資源的連結：

基本演算法描述：說明演算法的用途及其運作方式，並概述演算法可能很有用的可能商務案例。
技術參考：視需要提供演算法實作的技術詳細數據，並提供學術參考。列出您可以設定的參數，以控制演算法的行為，並在模型中自定義結果。描述數據需求，並盡可能提供效能秘訣。
模型內容：說明資訊如何在每種類型的數據採礦模型中結構化，並說明如何解譯儲存在每個節點中的資訊。
數據採礦查詢：提供多個查詢，您可以搭配每個模型類型使用。範例包括內容查詢，可讓您深入瞭解模型中的模式，以及預測查詢，以協助您根據這些模式建置預測。

主題	描述
判斷數據採礦模型所使用的演算法	查詢用來建立採礦模型的參數
建立自定義 Plug-In 演算法	外掛程式演演算法
使用演算法特定的查看器探索模型	數據採礦模型查看器
使用泛型數據表格式檢視模型的內容	使用Microsoft一般內容樹視圖器流覽模型
瞭解如何設定數據並使用演算法來建立模型	採礦結構（Analysis Services - 數據採礦）採礦模型（Analysis Services - 數據採礦）

另請參閱

數據採礦工具

共用方式為

資料採礦演算法（Analysis Services - 數據採礦）

選擇正確的演算法

依類型選擇演算法

依工作選擇演算法

另請參閱

意見反應

其他資源

共用方式為

資料採礦演算法 （Analysis Services - 數據採礦）

選擇正確的演算法

依類型選擇演算法

依工作選擇演算法

相關內容

相關工作

另請參閱

意見反應

其他資源

資料採礦演算法（Analysis Services - 數據採礦）