建立購物籃結構和模型 (中繼資料採礦教學課程)
現在您已經建立了資料來源檢視,接著要使用資料採礦精靈建立新的採礦結構。 在這項工作中,您將建立以 Microsoft 關聯演算法為基礎的採礦結構和採礦模型。
注意
如果出現 vAssocSeqLineItems 無法當做巢狀資料表使用的錯誤訊息,請返回本課程的上一個工作,並務必從 vAssocSeqLineItems 資料表 (多方) 拖曳至 vAssocSeqOrders 資料表 (一方),藉以建立多對一聯結。 您也可以用滑鼠右鍵按一下聯結線,編輯資料表之間的關聯性。
若要建立關聯採礦結構
在 SQL Server Data Tools (SSDT) 的 方案總管中,以滑鼠右鍵按一下[採礦結構],然後選取 [新增採礦結構] 以開啟 [資料採礦精靈]。
在 [歡迎使用資料採礦精靈] 頁面上,按 [下一步]。
在 [ 選取定義方法] 頁面上,確認已選取 [從現有的關係資料庫或資料倉儲 ],然後按 [ 下一步]。
在 [ 建立資料採礦結構 ] 頁面的 [ 您要使用哪些資料採礦技術?] 底下,從清單中選取 [Microsoft 關聯規則 ],然後按 [ 下一步]。 [ 選取資料來源檢視 ] 頁面隨即出現。
選取[可用的資料來源檢視] 底下的[訂單],然後按 [下一步]。
在 [ 指定資料表類型 ] 頁面上,于 vAssocSeqLineItems 資料表的資料列中,選取 [巢狀 ] 核取方塊,然後在巢狀資料表 vAssocSeqOrders 的資料列中,選取 [案例 ] 核取方塊。 按一下 [下一步] 。
在 [ 指定定型資料 ] 頁面上,清除任何可能核取的方塊。 選取 OrderNumber 旁的 [金鑰] 核取方塊,以設定 case 資料表 vAssocSeqOrders 的 索引鍵 。
因為購物籃分析的目的是要判斷哪些產品包含在單一交易中,所以您不需要使用 CustomerKey 欄位。
選取 [模型] 旁的 [金鑰] 核取方塊,以設定巢狀資料表 vAssocSeqLineItems 的索引 鍵 。 當您執行此動作時,也會自動選取 [ 輸入 ] 核取方塊。 選取 [
Model
可預測] 核取方塊。在購物籃模型中,您不關心購物籃中的產品順序,因此您不應該將 LineNumber 作為巢狀資料表的索引鍵。 您只會在序列很重要的模型中使用 LineNumber 做為索引鍵。 您將在第 4 課中建立使用 Microsoft Sequence Clustering 演算法的模型。
選取 IncomeGroup 和 Region 左邊的核取方塊,但不要選取其他任何選項。 檢查最左邊的資料行時,會將資料行加入到結構中供您日後參考,但是不會用於模型中。 您的選擇應該如下所示:
應該
按一下 [下一步] 。
在 [ 指定資料行的內容和資料類型]頁面上,檢閱選取範圍,如下表所示,然後按 [ 下一步]。
資料行 內容類型 資料類型 IncomeGroup Discrete Text 訂單編號 答案 Text 區域 Discrete Text vAssocSeqLineItems 型號 答案 Text 在 [ 建立測試集 ] 頁面上,測試資料百分比選項 的 預設值為 30%。 將此變更為 0。 按一下 [下一步] 。
注意
Analysis Services 提供用於測量模型精確度的不同圖表。 不過,有些圖表類型 (例如增益圖和交叉驗證報告),是專為分類和估計而設計。 這些方法不支援用於關聯式預測。
在 [ 正在完成精靈] 頁面上的 [採礦結構名稱] 中,輸入
Association
。在 [採礦模型名稱] 中,輸入
Association
。選取 [ 允許鑽研] 選項,然後按一下 [ 完成]。
資料採礦Designer會開啟以顯示您剛才建立的
Association
採礦結構。