创建预测(数据挖掘基础教程)

测试完挖掘模型的准确性并确定对这些模型满意之后,便可使用数据挖掘设计器中**“挖掘模型预测”**选项卡上的预测查询生成器来创建数据挖掘扩展插件 (DMX) 预测查询。

预测查询生成器有三个视图。 使用**“设计”“查询”视图,可以生成并检查查询。 然后可以在“结果”**视图中运行查询并查看结果。

有关如何使用预测查询生成器的详细信息,请参阅创建 DMX 预测查询

创建查询

创建预测查询的第一步是选择挖掘模型和输入表。

选择模型和输入表

  1. 在数据挖掘设计器的**“挖掘模型预测”选项卡的“挖掘模型”框中,单击“选择模型”**。

  2. 在**“选择挖掘模型”对话框中,在树中导航到 Targeted Mailing 结构,展开该结构,选择 TM_Decision_Tree,然后单击“确定”**。

  3. 在**“选择输入表”框中,单击“选择事例表”**。

  4. 在**“选择表”对话框中的“数据源”**列表中,选择 Adventure Works DW2008。

  5. 在**“表/视图名称”中选择 ProspectiveBuyer (dbo) 表,然后单击“确定”**。

    ProspectiveBuyer 表与 vTargetMail 事例表非常相似。

映射列

选择输入表之后,预测查询生成器便会根据各列的名称在挖掘模型和输入表之间创建默认映射。 结构中至少有一列必须与外部数据中的某列匹配。

重要说明重要提示

用于确定模型准确性的数据必须包含可以映射到可预测列的列。

将结构列映射到输入表列

  1. 右键单击将**“挖掘模型”窗口与“选择输入表”窗口连接起来的线,然后选择“修改连接”**。

    注意并非映射每个列。 我们将为几个**“表列”**添加映射。

  2. 在**“表列”**下方,单击 Bike Buyer 单元格并从下拉列表中选择 ProspectiveBuyer.Unknown。

    这样便将可预测列 [Bike Buyer] 映射到一个输入表列。

  3. 单击“确定”。

  4. 解决方案资源管理器中,右键单击 Targeted Mailing 数据源视图并选择**“视图设计器”**。

  5. 右键单击 ProspectiveBuyer 表标题并选择**“新建命名计算”**。

  6. 在“列名”框中,键入 calcAge。

  7. 在**“表达式”框中键入 DATEDIFF(YYYY,[BirthDate],getdate()),然后单击“确定”**。

    输入表没有相应的 Age 列。 此表达式将通过输入表的 BirthDate 列来计算客户年龄。 由于 Age 被标识为对预测自行车购买最有影响的列,因此它必须在模型和输入表中都存在。

  8. 在数据挖掘设计器中,选择**“挖掘模型预测”选项卡,并重新打开“修改连接”**窗口。

  9. 在**“表列”**下方,单击 Bike Buyer 单元格并从下拉列表中选择 ProspectiveBuyer.calcAge。

  10. 单击**“确定”**。

设计预测查询

设计预测查询

  1. “挖掘模型预测”选项卡的工具栏中的第一个按钮是“切换到设计视图”/“切换到结果视图”/“切换到查询视图”按钮。 单击此按钮上的向下箭头,然后选择“设计”

  2. 在**“挖掘模型预测”选项卡上网格内,单击“源”列中第一个空行中的单元格,然后选择“预测函数”**。

    这将指定 PredictProbability 函数的目标列。 有关函数的详细信息,请参阅数据挖掘扩展插件 (DMX) 函数参考

  3. 在**“预测函数”行的“字段”**列中,选择 PredictProbability

  4. 从**“挖掘模型”窗口的上方选择 [Bike Buyer],并将其拖到“条件/参数”**单元格中。

    释放鼠标后,[TM_Decision_Tree].[Bike Buyer] 会显示在“条件/参数”单元格中。

  5. 单击**“源”**列中的下一个空行,然后选择 TM_Decision_Tree。

  6. TM_Decision_Tree 行的**“字段”**列中,选择 Bike Buyer

  7. TM_Decision_Tree 行中,在**“条件/参数”**列中,键入 =1。

  8. 在**“源”**列中,单击下一个空行,然后选择 ProspectiveBuyer

  9. ProspectiveBuyer 行的 **“字段”**列中,选择 ProspectiveBuyerKey

    这会将唯一标识符添加到预测查询中,从而能够标识谁可能购买自行车,以及谁不可能购买自行车

  10. 向网格中添加五个以上行。 对于每个行,请选择 ProspectiveBuyer 作为**“源”,然后在“字段”**单元格中添加以下列:

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

最后,运行查询并浏览结果。

运行查询并查看结果。

  1. 在**“挖掘模型预测”选项卡中,选择“结果”**按钮。

  2. 运行查询并显示结果后,您可以查看结果。

    **“挖掘模型预测”**选项卡显示有可能购买自行车的潜在客户的联系信息。 **“表达式”**列指示预测的正确概率。 您可以根据这些结果来确定向哪些潜在客户发送邮件。

  3. 单击**“保存”**按钮保存结果。