データ型 (データ マイニング)
Microsoft SQL Server Analysis Services でマイニング モデルまたはマイニング構造を作成する場合は、マイニング構造のそれぞれの列に対してデータ型を定義する必要があります。データ マイニング エンジンは、データ型に基づいて、データ ソース内のデータが数値とテキストのどちらであるか、およびデータをどのように処理するかを判断します。たとえば、ソース データに数値データが含まれる場合、数値を整数として扱うかまたは小数点を使用して扱うかを指定できます。
各データ型では、1 つまたは複数のコンテンツの種類がサポートされます。コンテンツの種類を設定することで、マイニング モデルで列のデータをどのように処理または計算するかをカスタマイズできます。
たとえば、列に数値データが含まれる場合、数値データ型またはテキスト データ型のどちらとしてそのデータを処理するかを選択できます。数値データ型を選択した場合は、いくつかの異なるコンテンツの種類を設定できます。数値を分離することも、連続値として処理することもできます。すべてのコンテンツの種類の一覧については、「コンテンツの種類 (データ マイニング)」を参照してください。
Analysis Services では、では、マイニング構造列に対して次のデータ型がサポートされています。
データ型 |
サポートされているコンテンツの種類 |
---|---|
Text |
Cyclical、Discrete、Discretized、Key Sequence、Ordered、Sequence |
Long |
Continuous、Cyclical、Discrete、Discretized、Key、Key Sequence、Key Time、Ordered、Sequence、Time 分類済み |
Boolean |
Cyclical、Discrete、Ordered |
Double |
Continuous、Cyclical、Discrete、Discretized、Key、Key Sequence、Key Time、Ordered、Sequence、Time 分類済み |
Date |
Continuous、Cyclical、Discrete、Discretized、Key、Key Sequence、Key Time、Ordered |
注 |
---|
コンテンツの種類のうち Time および Sequence は、サード パーティのアルゴリズムでのみサポートされています。コンテンツの種類 Cyclical および Ordered はサポートされますが、多くのアルゴリズムはこれらを不連続の値として扱い、特別な処理は行いません。 |
データ型の指定
データ マイニング拡張機能 (DMX) を使用してマイニング モデルを直接作成する場合は、モデルを定義するときにそれぞれの列のデータ型を定義できます。Analysis Services は、指定されたデータ型を持つ対応するマイニング構造を同時に作成します。ウィザードを使用してマイニング モデルまたはマイニング構造を作成する場合は、Analysis Services によってデータ型が提案されます。一覧からデータ型を選択することもできます。
データ型の変更
列のデータ型を変更する場合は、マイニング構造およびその構造に基づくすべてのマイニング モデルを必ず再処理する必要があります。データ型を変更する場合、特定のモデルでその列を使用できない場合があります。その場合、Analysis Services は、モデルの再処理時にエラーを発生するか、またはその特定の列を除外してモデルを処理します。