AMO 数据挖掘类
数据挖掘类可帮助您创建、修改、删除和处理数据挖掘对象。处理数据挖掘对象包括创建数据挖掘结构、创建数据挖掘模型以及处理这些模型。
有关如何设置环境以及有关 Server、Database、DataSource 和 DataSourceView 对象的详细信息,请参阅AMO 基础类。
定义分析管理对象 (AMO) 中的对象需要设置每个对象的多个属性以设置正确的上下文。复杂对象(例如 OLAP 和数据挖掘对象)需要较长且详细的编码。
本主题包含以下各节:
MiningStructure 对象
MiningModel 对象
下图显示了本主题中介绍的类之间的关系。
MiningStructure 对象
挖掘结构是挖掘模型的容器。该结构定义了挖掘模型可使用的所有可能列。每个挖掘模型都在该挖掘结构的已定义列集中定义自己的列。
简单的 MiningStructure 对象包括基本信息、数据源视图、一个或多个 ScalarMiningStructureColumn、零个或多个 TableMiningStructureColumn 以及 MiningModelCollection。
基本信息包括 MiningStructure 对象的名称和 ID(内部标识符)。
DataSourceView 对象包含挖掘结构的基础数据模型。
ScalarMiningStructureColumn 是具有单个值的列或属性。
TableMiningStructureColumn 是具有每个事例的多个值的列或属性。
MiningModelCollection 包含根据同一数据生成的所有挖掘模型。
MiningStructure 对象是通过以下方式创建的:将其添加到数据库的 MiningStructureCollection,然后使用 Update 方法将 MiningStructure 对象更新到服务器中。
若要删除 MiningStructure 对象,必须使用 MiningStructure 对象的 Drop 方法来删除。从集合中删除 MiningStructure 对象不会影响服务器。
MiningStructure 可使用它自己的处理方法进行处理,也可在父对象使用自己的处理方法进行自身处理时进行处理。
列
列包含模型的数据,根据用法不同可为不同类型:Key、Input、Predictable 或 InputPredictable。可预测列是生成挖掘模型的目标。
单值列在 AMO 中称为 ScalarMiningStructureColumn。多值列称为 TableMiningStructureColumn。
ScalarMiningStructureColumn
简单的 ScalarMiningStructureColumn 对象由基本信息、类型、内容和数据绑定组成。
基本信息包括 ScalarMiningStructureColumn 的名称和 ID(内部标识符)。
类型是指值的数据类型:LONG、BOOLEAN、TEXT、DOUBLE、DATE。
内容告知引擎如何对列进行建模。值可以为:Discrete、Continuous、Discretized、Ordered、Cyclical、Probability、Variance、StdDev、ProbabilityVariance、ProbabilityStdDev、Support 和 Key。
数据绑定通过数据源视图元素将数据挖掘列链接到基础数据模型。
ScalarMiningStructureColumn 是通过以下方式创建的:将其添加到父 MiningStructureCollection,然后使用 Update 方法将父 MiningStructure 对象更新到服务器中。
若要删除 ScalarMiningStructureColumn,则必须从父 MiningStructure 集合中将其删除,然后必须使用 Update 方法将父 MiningStructure 对象更新到服务器中。
TableMiningStructureColumn
简单的 TableMiningStructureColumn 对象由基本信息和标量列组成。
基本信息包括 TableMiningStructureColumn 的名称和 ID(内部标识符)。
标量列为 ScalarMiningStructureColumn。
TableMiningStructureColumn 是通过以下方式创建的:将其添加到父 MiningStructure 集合,然后使用 Update 方法将父 TableMiningStructureColumn 对象更新到服务器中。
若要删除 ScalarMiningStructureColumn,必须从父 MiningStructure 集合中将其删除,然后必须使用 Update 方法将父 MiningStructure 对象更新到服务器中。
MiningModel 对象
MiningModel 对象可用于选择要使用结构中的哪些列、要使用的算法以及用于优化模型的可选特定参数。例如,您可能想要在同一个挖掘结构中定义使用相同算法的多个挖掘模型,但要在一个模型中忽略挖掘结构的某些列,而在另一个模型中将这些列用作输入,在第三个模型中将这些列用作输入和预测。当在一个挖掘模型中要将某列视为连续列,而在另一个模型中您要将该列视为离散化列时,此对象非常有用。
简单的 MiningModel 对象由基本信息、算法定义和列组成。
基本信息包括挖掘模型的名称和 ID(内部标识符)。
算法定义是指 Analysis Services 中提供的任一标准算法,或服务器上启用的任何自定义算法。
列是算法及其用法定义所用列的集合。
MiningModel 是通过以下方式创建的:将其添加到数据库的 MiningModelCollection,然后使用 Update 方法将 MiningModel 对象更新到服务器中。
若要删除 MiningModel,则必须使用 MiningModel 的 Drop 方法来删除。从集合中删除 MiningModel 不会影响服务器。
创建 MiningModel 后,便可使用它自己的处理方法进行处理,也可在父对象使用自己的处理方法进行自身处理时进行处理。