共用方式為


建立時序群集採礦模型結構 (中繼資料採礦教學課程)

建立時序群集採礦模型的第一個步驟是使用資料採礦精靈,根據 Microsoft 時序群集演算法建立新的採礦結構和採礦模型。

您將會使用與購物籃分析相同的資料來源檢視,但是您會加入一個包含 sequence 識別碼的資料行。 在此案例中,時序表示客戶將項目加入到購物籃的順序。

您也會加入某些資料行,這些資料行會在其中一個模型內使用,以根據人口統計資料來分組客戶。

若要建立時序群集結構和模型

  1. 在 [SQL Server Data Tools (SSDT) ] 方案總管中,以滑鼠右鍵按一下[採礦結構],然後選取 [新增採礦結構]。

  2. [歡迎使用資料採礦精靈] 頁面上,按 [下一步]

  3. 在 [ 選取定義方法 ] 頁面上,確認已選取 [從現有的關係資料庫或資料倉儲 ],然後按 [ 下一步]。

  4. 在 [ 建立資料採礦結構] 頁面上,確認已選取 [ 使用採礦模型建立採礦結構 ] 選項。 接下來,按一下選項的下拉式清單: 您要使用哪些資料採礦技術?,然後選取 [Microsoft 時序叢集]。 按一下 [下一步] 。

    [ 選取資料來源檢視 ] 頁面隨即出現。 在 [可用的資料來源檢視] 底下,選取 Orders

    Orders 是您用於購物籃分析案例的相同資料來源檢視。 如果您尚未建立此資料來源檢視,請參閱使用 巢狀資料表新增資料來源檢視 (中繼資料採礦教學課程)

  5. 按一下 [下一步] 。

  6. 在 [指定資料表類型]頁面上,選取vAssocSeqOrders資料表旁邊的[案例] 核取方塊,然後選取vAssocSeqLineItems資料表旁的[巢狀] 核取方塊。 按一下 [下一步] 。

    注意

    如果您選取 [案例 ] 或 [ 巢狀 ] 核取方塊時發生錯誤,可能是資料來源檢視中的聯結不正確。 巢狀資料表 vAssocSeqLineItems必須透過多對一聯結連接到案例資料表 vAssocSeqOrders 。 您可以用滑鼠右鍵按一下聯結線並反轉聯結的方向,藉以編輯關聯性。 如需詳細資訊,請參閱 建立或編輯關聯性對話方塊 (Analysis Services - 多維度資料)

  7. 在 [ 指定定型資料 ] 頁面上,選取核取方塊以選擇要在模型中使用的資料行,如下所示:

    • IncomeGroup 選取 [ 輸入] 核取方塊。

      這個資料行包含有關您可用於群集之客戶的有趣資訊。 您將會在第一個模型中使用它,然後在第二個模型中忽略它。

    • OrderNumberKey選取核取方塊。

      此欄位將會當做案例資料表的識別碼或 Key 使用。 一般來說,您絕對不應該使用案例資料表的索引鍵欄位當做輸入,因為此索引鍵包含對於群集沒什麼用處的唯一值。

    • 地區 選取 [ 輸入] 核取方塊。

      這個資料行包含有關您可用於群集之客戶的有趣資訊。 您將會在第一個模型中使用它,然後在第二個模型中忽略它。

    • LineNumberKey選取 和[輸入]核取方塊。

      LineNumber欄位將用來做為巢狀資料表的識別碼,或 Sequence Key 。 巢狀資料表的索引鍵永遠都必須用於輸入。

    • 模型 選取 [ 輸入 ] 和 [ 可預測] 核取方塊。

    確認選取專案正確無誤,然後按 [ 下一步]。

  8. 在 [ 指定資料行的內容和資料類型 ] 頁面上,確認方格包含下表所示的資料行、內容類型和資料類型,然後按 [ 下一步]。

    資料表/資料行 內容類型 資料類型
    IncomeGroup Discrete Text
    OrderNumber 答案 Text
    區域 Discrete Text
    vAssocSeqLineItems
    Line Number Key Sequence long
    型號 Discrete Text
  9. 在 [ 建立測試集] 頁面上,將 測試的資料百分比 變更為 20,然後按 [ 下一步]。

  10. 在 [ 正在完成精靈 ] 頁面上,針對 [採礦結構名稱] 輸入 Sequence Clustering with Region

  11. 針對 [採礦模型名稱],輸入 Sequence Clustering with Region

  12. 核取 [ 允許鑽研 ] 方塊,然後按一下 [ 完成]。

本課程的下一項工作

處理時序群集模型

另請參閱

資料採礦設計師
Microsoft 時序叢集演算法