資料採礦演算法 (Analysis Services - 資料採礦)
「資料採礦演算法」(Data Mining Algorithm) 是建立資料採礦模型的機制。若要建立模型,演算法首先會分析一組資料,尋找特定模式和趨勢。此演算法會使用此分析結果來定義採礦模型的參數。然後這些參數會套用到整個資料集以擷取可付諸行動的模式與詳細的統計資料。
演算法建立的採礦模型可以有各種形式,包括:
一組規則,描述交易中的產品如何群組在一起。
決策樹,預測特定客戶是否會購買產品。
預測銷售的數學模型。
一組叢集,描述資料集的案例如何相關。
MicrosoftSQL ServerAnalysis Services 會提供數種演算法供您在資料採礦方案中使用。這些演算法是適用於資料採礦之所有演算法的子集。您也可以使用符合 OLE DB for Data Mining 規格的協力廠商演算法。如需有關協力廠商演算法的詳細資訊,請參閱<外掛程式演算法>。
資料採礦演算法的類型
Analysis Services 包括下列演算法類型:
分類演算法會根據資料集內的其他屬性,預測一或多個分隔變數。Microsoft 決策樹演算法 為分類演算法的一個範例。
迴歸演算法會根據資料集內的其他屬性,預測一或多個連續變數,例如利潤或損失。Microsoft 時間序列演算法 為迴歸演算法的一個範例。
分割演算法會將項目的資料劃分為具有相似屬性的群組或叢集。Microsoft 群集演算法 為分割演算法的一個範例。
關聯分析演算法會尋找資料集內的不同屬性之間的相互關聯。這種演算法最常應用在建立關聯規則,這些規則可以用在購物籃分析。Microsoft 關聯分析演算法 為關聯分析演算法的一個範例。
時序分析演算法會摘要資料的時序或時段,例如 Web 路徑流程。Microsoft 時序群集演算法 為時序分析演算法的一個範例。
套用演算法
選擇特定商務工作最適用的演算法並不容易。您可以使用不同的演算法來執行相同的商務工作,每一個演算法會產生不同的結果,且部分演算法還會產生一種以上的結果類型。例如,您可以使用 Microsoft 決策樹演算法,不僅用來預測也可以減少資料集內的資料行數目,因為決策樹可以識別不影響最終採礦模型的資料行。
您也不需要個別地使用演算法。在單一資料採礦方案中,您可以使用某些演算法來瀏覽資料,然後使用其他演算法來預測以這些資料為根據的特定結果。例如,您可以使用會辨識模式的群集演算法,將資料分解為同質性更高或更低的群組,然後使用結果來建立更好的決策樹模型。您可以在一個方案內使用多種演算法來執行個別的工作,例如,使用迴歸樹演算法來取得財務預測資訊,而使用以規則為基礎的演算法來執行購物籃分析。
採礦模型可以預測值、產生資料的摘要,以及尋找隱藏的相互關聯。為了協助您選取適合資料採礦方案的演算法,下表提供哪些演算法適用於特定工作的建議。
工作 |
適用的 Microsoft 演算法 |
---|---|
預測分隔屬性。 例如,預測目標郵寄活動的收件者是否會購買產品。 |
|
預測連續屬性。 例如,預測下一個年度的銷售。 |
|
預測序列。 例如,執行公司網站的點選流分析。 |
|
在交易中尋找通用項目的群組。 例如,使用購物籃分析來建議使用者購買其他產品。 |
|
尋找相似項目的群組。 例如,將人口統計資料分割為若干群組,以便更容易了解屬性之間的關聯性。 |
因為每一個模型會傳回不同類型的結果,Analysis Services 會為每一種演算法提供個別的檢視器。在 Analysis Services 中瀏覽採礦模型時,該模型會使用適合它的檢視器顯示在資料採礦設計師的 [採礦模型檢視器] 索引標籤上。如需詳細資訊,請參閱<檢視資料採礦模型>。
演算法詳細資料
下表提供可用於每個演算法之資訊類型的連結:
基本演算法描述:提供演算法用途與運作方式的基本說明,以及演算法可能相當實用的商務案例。
技術參考:列出您可以設定的參數,用於控制演算法的行為,並自訂模型中的結果。提供有關演算法實作、效能秘訣和資料需求的其他技術詳細資訊。
查詢模型:提供可用於每個模型類型的查詢範例。您可以查詢模型,學習更多有關模型中之模式的詳細資訊,或根據這些模式進行預測。
採礦模型內容:描述如何將所有模型類型的資訊儲存在一般結構中,並說明如何解譯該資訊。建立模型之後,可以使用 BI Development Studio 中提供的檢視器來瀏覽模型,或使用 DMX 撰寫查詢直接從模型內容傳回資訊。
基本演算法描述 |
技術參考 |
查詢 |
採礦模型內容 |
---|---|---|---|