数据类型(数据挖掘)

适用于:SQL Server 2019 及更早版本的 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

数据挖掘在 SQL Server 2017 Analysis Services 中已弃用,现在在 SQL Server 2022 Analysis Services 中已停止使用。 对于已弃用和停止使用的功能,文档不会更新。 若要了解详细信息,请参阅 Analysis Services 后向兼容性

在 Microsoft SQL Server SQL Server Analysis Services 中创建挖掘模型或挖掘结构时,必须为挖掘结构中的每个列定义数据类型。 数据类型告知分析引擎数据源中的数据是数值还是文本以及应如何处理数据。 例如,如果数据源中包含数值数据,则可以指定是将数字作为整数处理还是使用小数位数来处理。

SQL Server Analysis Services支持以下挖掘结构列的数据类型:

数据类型 支持的内容类型
文本 Cyclical、Discrete、Discretized、Key Sequence、Ordered 和 Sequence
Long Continuous、Cyclical、Discrete、Discretized、Key、Key Sequence、Key Time、Ordered、Sequence 和 Time

Classified
布尔值 Cyclical、Discrete 和 Ordered
双精度 Continuous、Cyclical、Discrete、Discretized、Key、Key Sequence、Key Time、Ordered、Sequence 和 Time

Classified
Date Continuous、Cyclical、Discrete、Discretized、Key、Key Sequence、Key Time 和 Ordered

注意

只有第三方算法支持 Time 和 Sequence 内容类型。 支持 Cyclical 和 Ordered 内容类型,但大多数算法将它们视为离散值,不会进行特殊处理。

该表还显示了每种数据类型支持的内容类型

内容类型特定于数据挖掘,你可以自定义在挖掘模型中处理或计算数据的方式。 例如,即使列中包含数字,你可能还是需要将其作为离散值进行建模。 如果列中包含数字,你还可以指定它们是装箱还是离散化,或者指定模型是否将它们作为连续值处理。 因此,内容类型对模型有极大的影响... 有关所有内容类型的列表,请参阅 content Types (Data Mining)

注意

在其他机器学习系统中,你可能会遇到以下术语:名义数据、因素或类别、序号数据或序列数据。 通常,这些术语与内容类型相对应。 在 SQL Server 中, 数据类型仅指定存储的值类型,而不指定其在模型中的用法。

指定数据类型

如果直接使用数据挖掘扩展插件 (DMX) 创建挖掘模型,则可以在定义该模型时定义每一列的数据类型,同时 Analysis Services 将创建对应的包含指定数据类型的挖掘结构。 如果通过使用向导创建挖掘模型或挖掘结构,Analysis Services 将建议一种数据类型,或者您可以从列表中选择一种数据类型。

更改数据类型

如果更改某一列的数据类型,则必须始终重新处理挖掘结构以及基于该结构的所有挖掘模型。 有时候,如果更改数据类型,则可能无法再在特定的模型中使用该列。 在这种情况下,Analysis Services 将在您重新处理该模型时引发一个错误,或者将处理该模型但忽略该特定列。

另请参阅

内容类型(数据挖掘)
内容类型 (DMX)
数据挖掘算法(Analysis Services – 数据挖掘)
挖掘结构(Analysis Services – 数据挖掘)
数据类型 (DMX)
挖掘模型列
挖掘结构列