共用方式為


Microsoft線性回歸演算法

適用於: SQL Server 2019 和舊版 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

SQL Server 2017 Analysis Services 中已淘汰數據採礦,現在已在 SQL Server 2022 Analysis Services 中停止。 檔不會更新為已淘汰和已停止的功能。 若要深入瞭解,請參閱 Analysis Services 回溯相容性

Microsoft線性回歸演算法是Microsoft判定樹演演算法的變化,可協助您計算相依變數與獨立變數之間的線性關聯性,然後使用該關聯性進行預測。

關聯性會採用最能代表一系列數據之線條的方程式形式。 例如,下圖中的線條是數據的最佳可能線性表示法。

一行,建立一組數據模型

圖表中的每個數據點都有與其與回歸線距離相關聯的錯誤。 回歸方程式中的係數 a 和 b 會調整回歸線的角度和位置。 您可以藉由調整 和 b 來取得回歸方程式,直到與所有點相關聯的錯誤總和達到其最小值為止。

還有其他種類的回歸使用多個變數,以及回歸的非線性方法。 不過,線性回歸是一種實用且已知的方法,可用來將回應模型化為某些基礎因素中的變更。

您可以使用線性回歸來判斷兩個連續數據行之間的關聯性。 例如,您可以使用線性回歸,從製造或銷售數據計算趨勢線。 您也可以使用線性回歸作為開發更複雜的數據採礦模型的前身,來評估數據行之間的關聯性。

雖然有許多方法可以計算不需要數據採礦工具的線性回歸,但針對這項工作使用Microsoft線性回歸演算法的優點是變數之間的所有可能關聯性都會自動計算和測試。 您不需要選取計算方法,例如解決最小平方。 不過,在多個因素影響結果的案例中,線性回歸可能會過度簡化關聯性。

演算法的運作方式

Microsoft線性回歸演算法是Microsoft判定樹演演算法的變化。 當您選取Microsoft線性回歸演算法時,會叫用Microsoft判定樹演算法的特殊案例,且參數會限制演算法的行為,而且需要特定輸入數據類型。 此外,在線性回歸模型中,整個數據集用於在初始階段中計算關聯性,而標準判定樹模型會將數據重複分割成較小的子集或樹狀結構。

線性回歸模型所需的數據

當您準備數據以用於線性回歸模型時,您應該瞭解特定演算法的需求。 這包括需要多少數據,以及如何使用數據。 此模型類型的需求如下:

  • 單一索引鍵數據行 每個模型必須包含一個可唯一識別每筆記錄的數值或文字數據行。 不允許複合索引鍵。

  • 一個可預測的數據行 至少需要一個可預測的數據行。 您可以在模型中包含多個可預測屬性,但可預測屬性必須是連續數值數據類型。 即使數據的原生記憶體是數值,您也無法使用 datetime 資料類型做為可預測的屬性。

  • 輸入數據行 輸入數據行必須包含連續數值數據,並指派適當的數據類型。

如需詳細資訊,請參閱 Microsoft 線性回歸演算法技術參考的需求一節。

檢視線性回歸模型

若要探索模型,您可以使用 Microsoft 樹檢視。 線性回歸模型的樹狀結構非常簡單,其中包含單一節點中有關回歸方程式的所有資訊。 如需詳細資訊,請參閱 使用 Microsoft 樹檢視器流覽模型

如果您想要深入瞭解方程式的詳細資訊,您也可以使用 Microsoft 泛型內容樹視圖器來檢視係數和其他詳細數據。

對於線性回歸模型,模型內容包含元數據、回歸公式,以及輸入值分佈的相關統計數據。 如需詳細資訊,請參閱 線性回歸模型的採礦模型內容(Analysis Services - 資料採礦)

建立預測

處理模型之後,結果會儲存為一組統計數據,以及線性回歸公式,可用來計算未來的趨勢。 如需與線性回歸模型搭配使用的查詢範例,請參閱 線性回歸模型查詢範例

如需如何針對採礦模型建立查詢的一般資訊,請參閱 數據採礦查詢

除了藉由選取 Microsoft線性回歸演算法來建立線性回歸模型,如果可預測屬性是連續數值數據類型,您也可以建立包含回歸的判定樹模型。 在此情況下,演算法會在找到適當的分隔點時分割數據,但針對某些數據區域,將會改為建立回歸公式。 如需判定樹模型內回歸樹狀結構的詳細資訊,請參閱 判定樹模型(Analysis Services - 數據採礦)的採礦模型內容

言論

  • 不支援使用預測模型標記語言 (PMML) 來建立採礦模型。

  • 不支援建立數據採礦維度。

  • 支援鑽研。

  • 支援使用 OLAP 採礦模型。

另請參閱

數據採礦演算法 (Analysis Services - 數據採礦)
Microsoft 線性回歸演算法技術參考
線性回歸模型查詢範例
線性回歸模型的採礦模型內容 (Analysis Services - 數據採礦)