创建市场篮结构和模型(数据挖掘中级教程)

现在您已经创建了一个数据源视图,您将使用数据挖掘向导创建一个新的挖掘结构。在本任务中,您将创建基于 Microsoft 关联算法的挖掘结构和挖掘模型。

注意注意

如果遇到说明 vAssocSeqLineItems 不能用作嵌套表的错误,请返回本课中的前一个任务,并确保通过从 vAssocSeqLineItems 表(多端)拖到 vAssocSeqOrders 表(一端)来创建多对一联接。还可以通过右键单击联接线来编辑这两个表之间的关系。

创建关联挖掘结构

  1. 在 Business Intelligence Development Studio 的解决方案资源管理器中,右键单击**“挖掘结构”,再选择“新建挖掘结构”**以打开数据挖掘向导。

  2. 在**“欢迎使用数据挖掘向导”页上,单击“下一步”**。

  3. 在**“选择定义方法”页上,确保已选中“从现有关系数据库或数据仓库”,再单击“下一步”**。

  4. 在**“创建数据挖掘结构”页的“您要使用何种数据挖掘技术?”下,选中列表中的“Microsoft 关联规则”,再单击“下一步”“选择数据源视图”**页随即显示。

  5. 在**“可用数据源视图”下选择 Orders,再单击“下一步”**。

  6. 在**“指定表类型”页上,为 vAssocSeqLineItems 选中“嵌套”复选框。为 vAssocSeqOrders 选中“事例”复选框。单击“下一步”**。

    尝试将 vAssocSeqLineItems 用作事例表,并且将 vAssocSeqOrders 用作事例表。您将收到错误。这些嵌套表必须始终位于与事例表具有的现有关系的“多”方。

  7. 在**“指定定型数据”页中,清除任何可能处于选中状态的复选框。通过选中 OrderNumber 旁边的“键”**复选框,为事例表 vAssocSeqOrders 设置键。

    由于市场篮分析的目的在于确定单个交易中包括哪些产品,因此您不必使用 CustomerKey 字段,

  8. 通过选中 Model 旁边的**“键”复选框,为嵌套表 vAssocSeqLineItems 设置键。当您这样做之后,会自动选中“输入”复选框。对于“模型”也选中“可预测”**复选框。

    在市场篮模型中,您不关心产品在购物篮中的顺序,因此,您不应当将 LineNumber 用作嵌套表的键,仅在顺序非常重要的模型中才将 LineNumber 用作键。您将在第 4 课中创建使用 Microsoft 顺序分析和聚类分析算法的模型。

  9. 选中 IncomeGroup 和 Region 左侧的复选框,但是不进行任何其他选择。通过选中该复选框,可以将这些列添加到结构中以供日后参考,但是不会将这些列用在模型中。

    您选择的内容应如下所示:

    对话框外观如何

  10. 单击**“下一步”**。

  11. 在**“指定列的内容和数据类型”页上,查看您选择的内容(应如下表所示),再单击“下一步”**。

    内容类型

    数据类型

    IncomeGroup

    Discrete

    Text

    Order Number

    Key

    Text

    Region

    Discrete

    Text

    vAssocSeqLineItems

      

      

    Model

    Key

    Text

  12. 在**“创建测试集”页上,“测试数据百分比”选项的默认值为 30%。请将该选项更改为 0。单击“下一步”**。

    注意注意

    在数据挖掘基础教程中,您创建了一个用来度量模型准确性的测试集。Analysis Services 提供的用来测试模型准确性的方法(如提升图和交叉验证报告)旨在进行分类和估计。关联预测不支持这些方法。

  13. 在**“完成向导”页的“挖掘结构名称”**中,键入 Association。

  14. 在**“挖掘模型名称”**中,键入 Association。

  15. 选择**“允许钻取”选项,然后单击“完成”**。

    系统将打开数据挖掘设计器,显示刚刚创建的 Association 挖掘结构。