モデルの検証と予測用モデルの使用 (Excel 用データ マイニング アドイン)
モデルのテストと検証は、データ マイニング プロセスにおける重要な手順です。 実際のデータに対するマイニング モデルの性能を、運用環境に配置する前に知っておく必要があります。
データ マイニング アドインには、構築したモデルをテストし、そのモデルを使用して予測と提案を作成するためのツールが含まれています。
精度チャート
精度グラフ ウィザードを使用すると、リフト チャートまたは散布図グラフを作成することで、予測クエリを作成し、データ マイニング モデルのパフォーマンスを評価できます。 ほぼ同じ構造を持つ 2 つのモデルを区別し、どちらの予測精度が高いかを調べるにはリフト チャートが有効です。
精度チャート (SQL Server データ マイニング アドイン)
分類マトリックス
分類マトリックス ウィザードを使用すると、予測クエリを作成して分類モデルのパフォーマンスを評価できます。 モデルによって生成された正確な予測と不正確な予測を両方示す概要グラフが出力されます。 分類マトリックスは、モデルによって値が正しく予測された頻度だけでなく、モデルによって最も頻繁に誤って予測された値も示されるので、非常に便利なツールです。
分類マトリックス (SQL Server データ マイニング アドイン)
利益チャート
Profit Chart ウィザードを使用すると、データ マイニング モデルを使用する利点を比較し、偽陽性と偽陰性の両方のコストを評価できます
この種類のチャートでは、モデルの予測精度が測定され、単位あたりのコストと全体のコストが組み込まれます。
Profit Chart (SQL Server データ マイニング アドイン)。
クロス検証
クロス検証は、データ セットの妥当性を評価しデータ セットに対するマイニング モデルの精度を評価するための、データ マイニング コミュニティで確立された方法です。 クロス検証では、データ セットをサブセットに分割し、モデルの作成、トレーニング、およびテストを各サブセットに対して繰り返し実行します。
クロス検証ウィザードを使用すると、データを分割するフォールドの数を指定し、これらのクロスセクション間の違いを統計的に記述するクロス検証レポートを提供できます。 これに基づいて、モデルが、すべてのトレーニング データに対して適切に機能しているか、特定のサブセットに偏っているかを判断できます。
クロス検証 (SQL Server データ マイニング アドイン)
クエリ ウィザード
クエリ ウィザードは、予測クエリを作成するのに役立つ対話型ツールです。 クエリによって、提案や将来の予測などを生成する方法が定義されます。
クエリ ウィザードでは、モデルを選択し、入力データを 1 つの値として、またはテーブルまたは範囲から指定すると、出力する列を選択できます。 また、確率スコアやその他の有用な統計情報を生成する関数をクエリに追加することもできます。
クエリ (SQL Server データ マイニング アドイン)
詳細クエリ エディター
Advanced クエリ エディターは、カスタム クエリの実行から、新しいモデルの作成とトレーニング、モデルの削除、または新しいデータ セットの作成まで、あらゆる種類の DMX ステートメントを作成するのに役立つ対話形式のダイアログ ボックスセットです。
参照
データの探索とクリーニング
データ マイニング モデルの作成
マイニング モデルの配置とスケーリング (Excel 用データ マイニング アドイン)