データ マイニング ソリューション
データ マイニング ソリューションとは、データ マイニング プロジェクトを少なくとも 1 つ含んだ Analysis Services ソリューションです。
このセクションの各トピックでは、SQL Server Analysis Services を使用した統合データ マイニング ソリューションの設計と実装の方法について説明します。 データ マイニング デザイン プロセスおよび関連ツールの概要については、「データ マイニングの概念」を参照してください。
データ マイニングに利用できるその他のプロジェクト タイプの詳細については、「データ マイニング ソリューションの関連プロジェクト」を参照してください。
リレーショナル ソリューションと 多次元ソリューションの比較
データ マイニング ソリューションの配置
ソリューションのチュートリアル
リレーショナル ソリューションと多次元ソリューションの比較
データ マイニング ソリューションには、多次元データ (既存のキューブ) のほか、純粋なリレーショナル データ (データ ウェアハウス内のテーブルやビュー)、テキスト ファイル、Excel ブック、さらには、外部データ ソースを使用することもできます。
既存の多次元データベース ソリューション内でデータ マイニング オブジェクトを作成できます。
通常、このようなソリューションは、既に作成済みのキューブが存在し、そのキューブをデータ ソースとしてデータ マイニングを実行する場合に作成します。 キューブに基づくモデルを移動したりバックアップしたりする際は、キューブも移動またはコピーする必要があります。
データ マイニング オブジェクト (補助的なデータ ソースやデータ ソース ビューを含む) だけを含み、リレーショナル データ ソースのみを使用するデータ マイニング ソリューションを作成できます。
これはデータ マイニング モデルの作成に適した方法です。一般に、処理やクエリは、リレーショナル データ ソースがその対象である場合に最も高速になります。 また、サーバー間でのモデルの移動とバックアップも、EXPORT コマンドや IMPORT コマンドを使用して簡単に実行できます。
データ マイニング ソリューションの配置
ソリューションの配置先となる Analysis Services のインスタンスは、多次元オブジェクトとデータ マイニング オブジェクトをサポートするモードで実行されている必要があります。つまり、テーブル モデルや PowerPivot データをホストするインスタンスにデータ マイニング オブジェクトを配置することはできません。
したがって、Visual Studio でデータ マイニング ソリューションを作成するときは、[Analysis Services 多次元およびデータ マイニング プロジェクト] テンプレートを必ず使用してください。
ソリューションを配置すると、データ マイニングに使用されるオブジェクトが、指定された Analysis Services インスタンスに作成されます。作成先は、ソリューション ファイルと同じ名前のデータベースになります。
リレーショナル ソリューションと多次元ソリューションの両方を配置する方法の詳細については、「データ マイニング ソリューションの配置」を参照してください。
ソリューションのチュートリアル
データ マイニング ウィザードを使用してデータ マイニング ソリューションを作成する方法の概要について説明します。
リレーショナル マイニング構造の作成
マイニング構造は、リレーショナル データやテキスト ファイルのほか、データ ソース ビューに組み込むことのできる各種のソースから作成できます。OLAP マイニング構造の作成
OLAP キューブのデータを基にマイニング構造を作成します。 OLAP データから作成したモデルは、データ マイニング ディメンションとして保存できるほか、データ セットやモデルを新しいキューブとして保存することもできます。
このセクションの内容
関連タスクおよびトピック
データ ソースとマイニング構造を含む基本的なデータ マイニング ソリューションを作成したら、そのソリューションを基礎として、新しいモデルの追加、モデルのテストや比較、予測の作成、データのサブセットに対する実験などを行うことができます。
詳細については、次のリンクを参照してください。
タスク |
トピック |
---|---|
作成するモデルのテスト、トレーニング データの質の検証、データ マイニング モデルの精度を表すグラフの作成 |
|
構造および関連モデルにデータを取り込むことによるモデルのトレーニング (新しいデータでのモデルの更新と拡張) |
|
マイニング モデルのカスタマイズ (トレーニング データへのフィルターの適用、異なるアルゴリズムの選択、高度なアルゴリズム パラメーターの設定) |
|
モデルのトレーニング用データにフィルターを適用することによるマイニング モデルのカスタマイズ |
|
データ マイニング ソリューションの更新と管理 |
Link TBD |