AMO 数据挖掘类
数据挖掘类可帮助您创建、修改、删除和处理数据挖掘对象。 处理数据挖掘对象包括创建数据挖掘结构、创建数据挖掘模型以及处理这些模型。
有关如何设置环境以及有关 Server、Database、DataSource 和 DataSourceView 对象的详细信息,请参阅AMO 基础类。
定义分析管理对象 (AMO) 中的对象需要设置每个对象的多个属性以设置正确的上下文。 复杂对象(例如 OLAP 和数据挖掘对象)需要较长且详细的编码。
本主题包含以下各节:
MiningStructure 对象
MiningModel 对象
下图显示了本主题中介绍的类之间的关系。
MiningStructure 对象
挖掘结构是挖掘模型的容器。 该结构定义了挖掘模型可使用的所有可能列。 每个挖掘模型都在该挖掘结构的已定义列集中定义自己的列。
简单的 MiningStructure 对象包括基本信息、数据源视图、一个或多个 ScalarMiningStructureColumn、零个或多个 TableMiningStructureColumn 以及 MiningModelCollection。
基本信息包括 MiningStructure 对象的名称和 ID(内部标识符)。
DataSourceView 对象包含挖掘结构的基础数据模型。
ScalarMiningStructureColumn 是具有单个值的列或属性。
TableMiningStructureColumn 是具有每个事例的多个值的列或属性。
MiningModelCollection 包含根据同一数据生成的所有挖掘模型。
MiningStructure 对象是通过以下方式创建的:将其添加到数据库的 MiningStructureCollection,然后使用 Update 方法将 MiningStructure 对象更新到服务器中。
若要删除 MiningStructure 对象,必须使用 MiningStructure 对象的 Drop 方法来删除。 从集合中删除 MiningStructure 对象不会影响服务器。
MiningStructure 可使用它自己的处理方法进行处理,也可在父对象使用自己的处理方法进行自身处理时进行处理。
列
列包含模型的数据,根据用法不同可为不同类型:Key、Input、Predictable 或 InputPredictable。 可预测列是生成挖掘模型的目标。
单值列在 AMO 中称为 ScalarMiningStructureColumn。 多值列称为 TableMiningStructureColumn。
ScalarMiningStructureColumn
简单的 ScalarMiningStructureColumn 对象由基本信息、类型、内容和数据绑定组成。
基本信息包括 ScalarMiningStructureColumn 的名称和 ID(内部标识符)。
类型是指值的数据类型:LONG、BOOLEAN、TEXT、DOUBLE、DATE。
内容告知引擎如何对列进行建模。 值可以为:Discrete、Continuous、Discretized、Ordered、Cyclical、Probability、Variance、StdDev、ProbabilityVariance、ProbabilityStdDev、Support 和 Key。
数据绑定通过数据源视图元素将数据挖掘列链接到基础数据模型。
ScalarMiningStructureColumn 是通过以下方式创建的:将其添加到父 MiningStructureCollection,然后使用 Update 方法将父 MiningStructure 对象更新到服务器中。
若要删除 ScalarMiningStructureColumn,则必须从父 MiningStructure 集合中将其删除,然后必须使用 Update 方法将父 MiningStructure 对象更新到服务器中。
TableMiningStructureColumn
简单的 TableMiningStructureColumn 对象由基本信息和标量列组成。
基本信息包括 TableMiningStructureColumn 的名称和 ID(内部标识符)。
标量列为 ScalarMiningStructureColumn。
TableMiningStructureColumn 是通过以下方式创建的:将其添加到父 MiningStructure 集合,然后使用 Update 方法将父 TableMiningStructureColumn 对象更新到服务器中。
若要删除 ScalarMiningStructureColumn,必须从父 MiningStructure 集合中将其删除,然后必须使用 Update 方法将父 MiningStructure 对象更新到服务器中。
MiningModel 对象
MiningModel 对象可用于选择要使用结构中的哪些列、要使用的算法以及用于优化模型的可选特定参数。 例如,您可能想要在同一个挖掘结构中定义使用相同算法的多个挖掘模型,但要在一个模型中忽略挖掘结构的某些列,而在另一个模型中将这些列用作输入,在第三个模型中将这些列用作输入和预测。 当在一个挖掘模型中要将某列视为连续列,而在另一个模型中您要将该列视为离散化列时,此对象非常有用。
简单的 MiningModel 对象由基本信息、算法定义和列组成。
基本信息包括挖掘模型的名称和 ID(内部标识符)。
算法定义是指 Analysis Services 中提供的任一标准算法,或服务器上启用的任何自定义算法。
列是算法及其用法定义所用列的集合。
MiningModel 是通过以下方式创建的:将其添加到数据库的 MiningModelCollection,然后使用 Update 方法将 MiningModel 对象更新到服务器中。
若要删除 MiningModel,则必须使用 MiningModel 的 Drop 方法来删除。 从集合中删除 MiningModel 不会影响服务器。
创建 MiningModel 后,便可使用它自己的处理方法进行处理,也可在父对象使用自己的处理方法进行自身处理时进行处理。