關聯模型的採礦模型內容 (Analysis Services - 數據採礦)
適用於: SQL Server 2019 和舊版 Analysis Services Azure Analysis Services Fabric/Power BI Premium
重要
SQL Server 2017 Analysis Services 中已淘汰數據採礦,現在已在 SQL Server 2022 Analysis Services 中停止。 檔不會更新為已淘汰和已停止的功能。 若要深入瞭解,請參閱 Analysis Services 回溯相容性。
本主題描述使用Microsoft關聯規則演算法之模型特有的採礦模型內容。 如需適用於所有模型類型之採礦模型內容的一般和統計術語的說明,請參閱 採礦模型內容(Analysis Services - 數據採礦)。
了解關聯模型的結構
關聯模型具有簡單的結構。 每個模型都有代表模型及其元數據的單一父節點,而每個父節點都有專案集和規則的一般清單。 專案集和規則不會組織在樹狀結構中,它們會先以專案集排序,接下來的規則如下圖所示。
關聯模型的模型內容
每個專案集都包含在自己的節點中(NODE_TYPE = 7)。 節點 包含專案集的定義、包含此專案集的案例數目,以及其他資訊。
每個規則也會包含在它自己的節點中(NODE_TYPE = 8)。 規則 描述項目關聯方式的一般模式。 規則就像是 IF-THEN 語句。 規則的左側會顯示現有的條件或條件集。 規則的右側會顯示數據集中通常與左側條件相關聯的專案。
注意 如果您想要擷取規則或專案集,您可以使用查詢只傳回您想要的節點類型。 如需詳細資訊,請參閱 關聯模型查詢範例。
關聯模型的模型內容
本節僅針對與關聯模型相關的採礦模型內容中的數據行提供詳細數據和範例。
如需架構數據列集中一般用途數據行的相關信息,例如MODEL_CATALOG和MODEL_NAME,請參閱 採礦模型內容 (Analysis Services - 數據採礦)。
MODEL_CATALOG
儲存模型的資料庫名稱。
MODEL_NAME
模型的名稱。
ATTRIBUTE_NAME
對應至此節點的屬性名稱。
NODE_NAME
節點的名稱。 對於關聯模型,此數據行包含與NODE_UNIQUE_NAME相同的值。
NODE_UNIQUE_NAME
節點的唯一名稱。
NODE_TYPE
關聯模型只會輸出下列節點類型:
節點類型標識碼 | 類型 |
---|---|
1 (模型) | 根節點或父節點。 |
7 (專案群組) | 專案集,或屬性值組的集合。 例子:Product 1 = Existing, Product 2 = Existing 或 Gender = Male 。 |
8 (規則) | 定義專案彼此關聯性的規則。 例: Product 1 = Existing, Product 2 = Existing -> Product 3 = Existing 。 |
NODE_CAPTION
與節點相關聯的標籤或標題。
項目集節點 以逗號分隔的項目清單。
規則節點 包含規則的左右兩側。
CHILDREN_CARDINALITY
指出目前節點的子係數目。
父節點 指出專案集加規則的總數。
注意
若要取得專案集和規則計數的明細,請參閱模型的根節點NODE_DESCRIPTION。
專案集或規則節點 Always 0。
PARENT_UNIQUE_NAME
節點父代的唯一名稱。
父節點 Always NULL。
專案集或規則節點 Always 0。
NODE_DESCRIPTION
節點內容的易記描述。
父節點 包含模型相關信息的逗號分隔清單:
專案 | 描述 |
---|---|
ITEMSET_COUNT | 模型中所有專案集的計數。 |
RULE_COUNT | 模型中所有規則的計數。 |
MIN_SUPPORT | 任何單一專案集的最低支援。 Note 此值可能與您為 MINIMUM _SUPPORT 參數設定的值不同。 |
MAX_SUPPORT | 任何單一專案集所找到的最大支援。 Note 此值可能與您為 MAXIMUM_SUPPORT 參數設定的值不同。 |
MIN_ITEMSET_SIZE | 最小專案集的大小,以項目計數表示。 值為 0 表示 遺漏 狀態被視為獨立專案。 注意MINIMUM_ITEMSET_SIZE 參數的預設值為 1。 |
MAX_ITEMSET_SIZE | 指出找到的最大專案集大小。 Note 此值受限於您在建立模型時為 MAX_ITEMSET_SIZE 參數設定的值。 此值永遠不能超過該值;不過,它可能更少。 預設值為 3。 |
MIN_PROBABILITY | 在模型中偵測到任何單一專案集或規則的最小機率。 範例:0.400390625 Note For itemsets,此值一律大於您在建立模型時為 MINIMUM_PROBABILITY 參數設定的值。 |
MAX_PROBABILITY | 在模型中偵測到任何單一專案集或規則的最大機率。 範例:1 附註 沒有參數可限制專案集的最大機率。 如果您想要排除太頻繁的專案,請改用 MAXIMUM_SUPPORT 參數。 |
MIN_LIFT | 模型針對任何專案集提供的最小增益量。 範例:0.14309369632511 注意:瞭解最小增益可協助您判斷任何一個專案集的增益是否重要。 |
MAX_LIFT | 模型針對任何專案集提供的最大增益量。 範例:1.95758227647523 注意 瞭解最大增益可協助您判斷任何一個專案集的增益是否重要。 |
Itemset 節點 Itemset 節點包含專案清單,顯示為逗號分隔的文字字串。
例:
Touring Tire = Existing, Water Bottle = Existing
這意味著旅遊輪胎和水瓶是一起購買的。
規則節點 規則節點包含規則的左側和右側,並以箭號分隔。
範例:Touring Tire = Existing, Water Bottle = Existing -> Cycling cap = Existing
這意味著,如果有人買了一個旅遊輪胎和水瓶,他們也可能買一個自行車帽。
NODE_RULE
XML 片段,描述內嵌在節點中的規則或專案集。
[父節點] [空白]。
專案集節點 空白。
規則節點 XML 片段包含規則的其他實用資訊,例如支援、信賴和專案數目,以及代表規則左側的節點標識符。
MARGINAL_RULE
空白。
NODE_PROBABILITY
與專案集或規則相關聯的機率或信賴分數。
父節點 Always 0。
專案集節點 專案集的機率。
規則節點 規則的信賴值。
MARGINAL_PROBABILITY
與NODE_PROBABILITY相同。
NODE_DISTRIBUTION
數據表包含非常不同的資訊,視節點是專案集還是規則而定。
[父節點] [空白]。
Itemset 節點 列出專案集中的每個專案,以及機率和支援值。 例如,如果專案集包含兩個產品,則會列出每個產品的名稱,以及包含每個產品的案例計數。
規則節點 包含兩個數據列。 第一個數據列會顯示規則右側的屬性,也就是預測的專案,以及信賴分數。
第二個數據列是關聯模型的唯一數據列;它包含規則右側專案集的指標。 指標會在ATTRIBUTE_VALUE數據行中表示為僅包含右側專案的專案集標識碼。
例如,如果規則是 If {A,B} Then {C}
,數據表會包含專案 {C}
的名稱,以及包含專案 C 專案集之節點的標識碼。
此指標很有用,因為您可以從專案集節點判斷所有案例中有多少案例包含右側產品。 受規則約束的案例 If {A,B} Then {C}
是專案集中所列 {C}
案例的子集。
NODE_SUPPORT
支援此節點的案例數目。
父節點 模型中的案例數目。
Itemset 節點 包含專案集中所有專案的案例數目。
規則節點 包含規則中所有專案的案例數目。
MSOLAP_MODEL_COLUMN
根據節點是專案集或規則而定,包含不同的資訊。
[父節點] [空白]。
專案集節點 空白。
規則節點 規則左側包含專案的專案集標識碼。 例如,如果規則是 If {A,B} Then {C}
,這個數據行會包含只包含 {A,B}
的專案集標識符。
MSOLAP_NODE_SCORE
[父節點] [空白]。
專案集節點 專案集的重要性分數。
規則節點 規則的重要性分數。
注意
專案集和規則的重要性會以不同的方式計算。 如需詳細資訊,請參閱 Microsoft 關聯演算法技術參考。
MSOLAP_NODE_SHORT_CAPTION
空白。