共用方式為


自訂採礦模型和結構

適用於: SQL Server 2019 和舊版 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

SQL Server 2017 Analysis Services 中已淘汰數據採礦,現在已在 SQL Server 2022 Analysis Services 中停止。 檔不會更新為已淘汰和已停止的功能。 若要深入瞭解,請參閱 Analysis Services 回溯相容性

選取符合業務需求的演算法之後,您可以透過下列方式自定義採礦模型,以可能改善結果。

  • 在模型中使用不同的數據行,或變更數據行的使用方式、內容類型或離散化方法。

  • 在採礦模型上建立篩選條件,以限制用於定型模型的數據。

  • 變更用來分析數據的演算法。

  • 設定演算法參數來控制臨界值、樹狀結構分割和其他重要條件。

本主題描述這些選項。

變更模型所使用的數據

您決定在模型中使用哪些數據行,以及如何使用和處理該數據,極大地影響分析的結果。 下列主題提供的資訊可協助您了解這些選擇。

使用特徵選取

SQL Server Analysis Services 中的大部分數據採礦演算法會使用稱為 特徵選取 的程式,只選取模型最有用的屬性。 減少數據行和屬性的數目可以改善模型的效能和品質。 可用的特徵選取方法會根據您選擇的演算法而有所不同。

特徵選取 (資料採礦)

變更使用量

您可以變更採礦模型中所包含的數據行,以及每個數據行的使用方式。 如果您未取得預期的結果,您應該以您做為輸入的數據行範例,並詢問數據行是否為不錯的選擇,以及是否有任何可改善數據的處理方式,包括:

  • 識別錯誤標示為數字的類別變數。

  • 新增類別以折疊屬性數目,並讓您更容易找到相互關聯。

  • 變更數位量化或離散化的方式。

  • 拿掉具有許多唯一值的數據行,或真正參考數據的數據行,並不適用於分析,例如位址或中間名稱。

您不需要從採礦結構實際移除數據行;您可以只將資料列標示為 Ignore。 數據行會從採礦模型中移除,但仍可供結構中的其他採礦模型使用,或鑽研查詢中所參考的 Ore。

建立模型數據行的別名

當 SQL Server Analysis Services 建立採礦模型時,它會使用採礦結構中的相同數據行名稱。 您可以將別名新增至採礦模型中的任何數據行。 這可能會讓您更容易了解數據行內容或使用方式,或縮短名稱以方便建立查詢。 當您想要建立數據行復本並將其命名為描述性內容時,別名也很有用。

您可以編輯採礦模型數據行 Name 屬性來建立別名。 SQL Server Analysis Services 會繼續使用原始名稱做為數據行的標識碼,而您輸入 Name 的新值 會變成數據行別名,並出現在數據行使用方式旁的方格中。

採礦模型數據行上的 別名

此圖顯示具有多個採礦結構數據行復本的相關模型,與 Income 相關。 結構數據行的每個復本都以不同的方式離散化。 圖表中的模型會分別使用與採礦結構不同的數據行;不過,為了方便比較模型的數據行,每個模型中的數據行已重新命名為 [Income]。

新增篩選

您可以將篩選新增至採礦模型。 篩選條件是一組 WHERE 條件,可將模型案例中的數據限製為某些子集。 篩選會在定型模型時使用,而且可以選擇性地用於測試模型或建立精確度圖表時。

藉由新增篩選,您可以重複使用採礦結構,但根據數據子集建立模型。 或者,您可以直接使用篩選來排除特定數據列並改善分析品質。

如需詳細資訊,請參閱 採礦模型的篩選 (Analysis Services - 數據採礦)

變更演算法

雖然新增至採礦結構的新模型會共用相同的數據集,但您可以使用不同的演算法來取得不同的結果(如果數據支援),或變更演算法的參數。 您也可以設定模型旗標。

演演算法的選擇會決定您將得到何種結果。 如需特定演算法運作方式的一般資訊,或您將受益於使用特定演算法的商務案例,請參閱 數據採礦演算法(Analysis Services - 數據採礦)

如需需求和限制的描述,請參閱每個演算法的技術參考主題,以及每個演算法所支援之自定義的詳細資訊。

自定義演算法參數

每個演算法都支援可用來自定義演算法行為的參數,並微調模型的結果。 如需如何使用每個參數的描述,請參閱下列主題:

每個演算法類型的主題也會列出可根據該演算法與模型搭配使用的預測函式。

屬性名稱 適用於
AUTO_DETECT_PERIODICITY Microsoft 時間序列演算法技術參考
CLUSTER_COUNT Microsoft 叢集演算法技術參考

Microsoft 時序群集演算法技術參考
CLUSTER_SEED Microsoft 叢集演算法技術參考
CLUSTERING_METHOD Microsoft 叢集演算法技術參考
COMPLEXITY_PENALTY Microsoft 判定樹演演算法技術參考

Microsoft 時間序列演算法技術參考
FORCE_REGRESSOR Microsoft 判定樹演演算法技術參考

Microsoft 線性回歸演算法技術參考

模型旗標 (數據採礦)
FORECAST_METHOD Microsoft 時間序列演算法技術參考
HIDDEN_NODE_RATIO Microsoft 類神經網路演算法技術參考
HISTORIC_MODEL_COUNT Microsoft 時間序列演算法技術參考
HISTORICAL_MODEL_GAP Microsoft 時間序列演算法技術參考
HOLDOUT_PERCENTAGE Microsoft 羅吉斯回歸演算法技術參考

Microsoft 類神經網路演算法技術參考

注意:此參數與套用至採礦結構的鑒效百分比值不同。
HOLDOUT_SEED Microsoft 羅吉斯回歸演算法技術參考

Microsoft 類神經網路演算法技術參考

注意:此參數與套用至採礦結構的鑒效組種子值不同。
INSTABILITY_SENSITIVITY Microsoft 時間序列演算法技術參考
MAXIMUM_INPUT_ATTRIBUTES Microsoft 叢集演算法技術參考

Microsoft 判定樹演演算法技術參考

Microsoft 線性回歸演算法技術參考

Microsoft 貝氏機率演演算法技術參考

Microsoft 類神經網路演算法技術參考

Microsoft 羅吉斯回歸演算法技術參考
MAXIMUM_ITEMSET_COUNT Microsoft 關聯演算法技術參考
MAXIMUM_ITEMSET_SIZE Microsoft 關聯演算法技術參考
MAXIMUM_OUTPUT_ATTRIBUTES Microsoft 判定樹演演算法技術參考

Microsoft 線性回歸演算法技術參考

Microsoft 羅吉斯回歸演算法技術參考

Microsoft 貝氏機率演演算法技術參考

Microsoft 類神經網路演算法技術參考
MAXIMUM_SEQUENCE_STATES Microsoft 時序群集演算法技術參考
MAXIMUM_SERIES_VALUE Microsoft 時間序列演算法技術參考
MAXIMUM_STATES Microsoft 叢集演算法技術參考

Microsoft 類神經網路演算法技術參考

Microsoft 時序群集演算法技術參考
MAXIMUM_SUPPORT Microsoft 關聯演算法技術參考
MINIMUM_IMPORTANCE Microsoft 關聯演算法技術參考
MINIMUM_ITEMSET_SIZE Microsoft 關聯演算法技術參考
MINIMUM_DEPENDENCY_PROBABILITY Microsoft 貝氏機率演演算法技術參考
MINIMUM_PROBABILITY Microsoft 關聯演算法技術參考
MINIMUM_SERIES_VALUE Microsoft 時間序列演算法技術參考
MINIMUM_SUPPORT Microsoft 關聯演算法技術參考

Microsoft 叢集演算法技術參考

Microsoft 判定樹演演算法技術參考

Microsoft 時序群集演算法技術參考

Microsoft 時間序列演算法技術參考
MISSING_VALUE_SUBSTITUTION Microsoft 時間序列演算法技術參考
MODELLING_CARDINALITY Microsoft 叢集演算法技術參考
PERIODICITY_HINT Microsoft 時間序列演算法技術參考
PREDICTION_SMOOTHING Microsoft 時間序列演算法技術參考
SAMPLE_SIZE Microsoft 叢集演算法技術參考

Microsoft 羅吉斯回歸演算法技術參考

Microsoft 類神經網路演算法技術參考
SCORE_METHOD Microsoft 判定樹演演算法技術參考
SPLIT_METHOD Microsoft 判定樹演演算法技術參考
STOPPING_TOLERANCE Microsoft 叢集演算法技術參考

另請參閱

數據採礦演算法 (Analysis Services - 數據採礦)
實體架構 (Analysis Services - 數據採礦)