在数据挖掘设计器中管理挖掘模型
在数据挖掘设计器的**“挖掘模型”**选项卡上,可以修改挖掘结构中现有的挖掘模型,还可以将新的挖掘模型添加到挖掘结构中。挖掘模型基于用数据挖掘向导定义的挖掘结构。
**“挖掘模型”**选项卡由网格组成,其中有一列描述挖掘结构,其他列则描述各个关联的挖掘模型。该网格的结构列中的各单元列出了在挖掘结构中定义的列,而网格的挖掘模型列中的各单元则列出了挖掘模型如何从挖掘结构使用列。
在**“挖掘模型”选项卡中,可以处理挖掘模型或创建新的挖掘模型。可以使用“属性”窗口来调整挖掘结构及其关联的挖掘模型的属性。可以使用“算法参数”**对话框来调整用于定义挖掘模型的算法的参数。
有关详细信息,请参阅:处理数据挖掘对象、在挖掘结构中设置列属性、设置挖掘模型的属性和“挖掘模型”选项卡操作指南主题
定义新的挖掘模型
完成数据挖掘向导后,解决方案资源管理器中的**“挖掘结构”**文件夹将包含一个基于在向导中定义的挖掘结构的挖掘模型。您可以使用数据挖掘设计器向该挖掘结构添加其他模型。尽管新模型都必须共享同样的挖掘结构,但您可以为每个模型改变算法类型、列用法和特定于算法的参数。
基于单个挖掘结构创建多个模型有以下几种好处:
每个算法类型以不同的方式显示结果。基于同一结构定义多个模型使得您可以从同一数据获取不同的信息。例如,您可能想要使用聚类分析模型来浏览数据,并使用决策树模型来根据该数据创建预测。
挖掘模型的结果会受参数设置方式的影响。您可以创建几个不同的模型,使这些模型具有相同的算法,但它们的某特定参数的设置都各不相同。您可以对比这些结果以便为算法选择最好的设置。
可以对模型应用筛选器以控制为模型定型和测试模型时所用的数据。
挖掘模型的结果受所选择的输入列的影响。可以生成几个只有所用的输入列不同的模型,然后比较其结果来决定应将哪些列用作输入。
有关详细信息,请参阅如何在现有挖掘结构中添加挖掘模型、数据挖掘算法(Analysis Services – 数据挖掘)和为挖掘模型创建筛选器(Analysis Services – 数据挖掘)
编辑现有挖掘模型
在**“挖掘模型”**选项卡上,可以对已创建的模型进行更改。可以修改算法类型、模型名称和特定于各算法的参数。还可以更改列用法、为模型列添加别名,以及创建定型和测试时应用到挖掘模型的筛选器。
有关详细信息,请参阅“挖掘模型”选项卡操作指南主题
也可以通过在**“挖掘结构”**选项卡中更改基础挖掘结构的方式来修改挖掘模型。
有关详细信息,请参阅在数据挖掘设计器中管理挖掘结构
更改挖掘列用法
可以使用**“挖掘模型”选项卡上的网格中的模型列单元来更改要包括在挖掘模型中的列及每个列的使用方式,如输入、键或可预测性。每个单元都与挖掘结构中的某一列相对应。对于键列,可以将单元设置为“键”或“忽略”**。对于输入和输出列,可以将单元设置为以下值:
忽略
输入
预测
PredictOnly
如果将一个单元设置为**“忽略”**,则该列将被从此挖掘模型中删除,但结构内的其他挖掘模型仍可使用该列。
对模型列使用别名
在 Analysis Services 创建挖掘模型时,它将使用挖掘结构中的列名称。您可以为挖掘模型中的任何列添加别名。这样可以使列内容或用法更易于理解,还可以缩短名称从而便于创建查询。
可以通过编辑挖掘模型列的 Name 属性来创建别名。Analysis Services 继续将原始名称用作列的 ID,而为“名称”键入的新值将作为列别名用括号括起来显示在网格中的列用法旁边。
此示例显示具有与收入有关的挖掘结构列的多个副本的相关模型。结构列的各个副本都已按照不同的方式离散化。关系图中的各个模型使用的列不同于挖掘结构;但是,为了便于对各个模型中的列进行比较,已将这些列重命名为 [收入]。
添加筛选器
您可以向挖掘模型添加筛选器。筛选器是一组 WHERE 条件,用于将模型事例中的数据限制为某些子集。筛选器可在为模型定型时使用,也可在测试模型或创建准确性图表时选择性地使用。
有关详细信息,请参阅为挖掘模型创建筛选器(Analysis Services – 数据挖掘)。