建立時序群集採礦模型結構 (中繼資料採礦教學課程)
建立時序群集採礦模型的第一個步驟是使用資料採礦精靈,根據 Microsoft 時序群集演算法建立新的採礦結構和採礦模型。
您將會使用與購物籃分析相同的資料來源檢視,但是您會加入一個包含 sequence
識別碼的資料行。 在此案例中,時序表示客戶將項目加入到購物籃的順序。
您也會加入某些資料行,這些資料行會在其中一個模型內使用,以根據人口統計資料來分組客戶。
若要建立時序群集結構和模型
在 [SQL Server Data Tools (SSDT) ] 方案總管中,以滑鼠右鍵按一下[採礦結構],然後選取 [新增採礦結構]。
在 [歡迎使用資料採礦精靈] 頁面上,按 [下一步]。
在 [ 選取定義方法 ] 頁面上,確認已選取 [從現有的關係資料庫或資料倉儲 ],然後按 [ 下一步]。
在 [ 建立資料採礦結構] 頁面上,確認已選取 [ 使用採礦模型建立採礦結構 ] 選項。 接下來,按一下選項的下拉式清單: 您要使用哪些資料採礦技術?,然後選取 [Microsoft 時序叢集]。 按一下 [下一步] 。
[ 選取資料來源檢視 ] 頁面隨即出現。 在 [可用的資料來源檢視] 底下,選取
Orders
。Orders 是您用於購物籃分析案例的相同資料來源檢視。 如果您尚未建立此資料來源檢視,請參閱使用 巢狀資料表新增資料來源檢視 (中繼資料採礦教學課程) 。
按一下 [下一步] 。
在 [指定資料表類型]頁面上,選取vAssocSeqOrders資料表旁邊的[案例] 核取方塊,然後選取vAssocSeqLineItems資料表旁的[巢狀] 核取方塊。 按一下 [下一步] 。
注意
如果您選取 [案例 ] 或 [ 巢狀 ] 核取方塊時發生錯誤,可能是資料來源檢視中的聯結不正確。 巢狀資料表 vAssocSeqLineItems必須透過多對一聯結連接到案例資料表 vAssocSeqOrders 。 您可以用滑鼠右鍵按一下聯結線並反轉聯結的方向,藉以編輯關聯性。 如需詳細資訊,請參閱 建立或編輯關聯性對話方塊 (Analysis Services - 多維度資料) 。
在 [ 指定定型資料 ] 頁面上,選取核取方塊以選擇要在模型中使用的資料行,如下所示:
IncomeGroup 選取 [ 輸入] 核取方塊。
這個資料行包含有關您可用於群集之客戶的有趣資訊。 您將會在第一個模型中使用它,然後在第二個模型中忽略它。
OrderNumber
Key
選取核取方塊。此欄位將會當做案例資料表的識別碼或
Key
使用。 一般來說,您絕對不應該使用案例資料表的索引鍵欄位當做輸入,因為此索引鍵包含對於群集沒什麼用處的唯一值。地區 選取 [ 輸入] 核取方塊。
這個資料行包含有關您可用於群集之客戶的有趣資訊。 您將會在第一個模型中使用它,然後在第二個模型中忽略它。
LineNumber
Key
選取 和[輸入]核取方塊。LineNumber欄位將用來做為巢狀資料表的識別碼,或
Sequence Key
。 巢狀資料表的索引鍵永遠都必須用於輸入。模型 選取 [ 輸入 ] 和 [ 可預測] 核取方塊。
確認選取專案正確無誤,然後按 [ 下一步]。
在 [ 指定資料行的內容和資料類型 ] 頁面上,確認方格包含下表所示的資料行、內容類型和資料類型,然後按 [ 下一步]。
資料表/資料行 內容類型 資料類型 IncomeGroup Discrete Text OrderNumber 答案 Text 區域 Discrete Text vAssocSeqLineItems Line Number Key Sequence long 型號 Discrete Text 在 [ 建立測試集] 頁面上,將 測試的資料百分比 變更為 20,然後按 [ 下一步]。
在 [ 正在完成精靈 ] 頁面上,針對 [採礦結構名稱] 輸入
Sequence Clustering with Region
。針對 [採礦模型名稱],輸入
Sequence Clustering with Region
。核取 [ 允許鑽研 ] 方塊,然後按一下 [ 完成]。