マイニング モデルのドキュメント化とスケーリング (Excel 用データ マイニング アドイン)
ドキュメント モデル ウィザードでは、作成したマイニング モデルに関する有用な情報を提供するレポートが作成されます。 作成したモデルをドキュメント化すると、モデルの生成に使用されるデータ ソースの追跡、モデルが処理された日時に関する詳細情報の取得、およびモデルの結果に影響するパラメーターの変更の追跡を実行できます。
モデルのドキュメント化ウィザードの使用
[ データ マイニング ] タブをクリックします。
[ モデルの使用状況] グループで、[ ドキュメント モデル] をクリックします。
[ モデルの選択 ] ダイアログ ボックスで、レポートするモデルを選択し、[ 次へ] をクリックします。 ドキュメント モデル ウィザードは、 ドキュメント化 するモデルごとに個別に実行する必要があります。
[ドキュメントの詳細の選択] ダイアログ ボックスで、[情報の入力] または [概要情報] の 2 つのオプションのいずれかを選択します。
[完了] をクリックします。
ウィザードは、指定されたレポートを含む新しいワークシートを自動的に作成します。" モデル ドキュメント"
レポートについて
データ マイニング モデルをドキュメント化するレポートを作成する場合は、モデルの名前や説明などの基本的な情報を示すサマリー レポートか、基になる構造やマイニング モデルに関する詳細情報を示す完全なレポートを作成できます。
モデルの作成に使用したアルゴリズムに応じて、示される情報の種類が異なります。 たとえば、アソシエーション モデルの場合は、生成されたアイテムセットおよびルールの数の把握に重点が置かれます。 クラスター モデルの場合は、クラスター数に重点が置かれます。
次の表に、オプションと各オプションのレポートで提供される情報を示します。
注意
レポート内の列は、既定で特定のサイズに設定されます。 したがって、列の名前または値が非常に長い場合、名前や値は表示されないか、Excel では ### と表示されます。 値を表示するには、行のサイズを変更します。 セルを選択し、両矢印をクリックして数式バーの右端までドラッグすると、値または文字列全体を表示できます。
サマリー レポート
Metadata | モデル名 モデルの説明 アルゴリズム名 最終処理日 |
|
モデルの結果 | 関連付け | アイテムセット数 ルール数 |
クラスタリング | クラスター数 各クラスターのサポート |
|
デシジョン ツリー | ツリー数 各ツリーのノード数 |
|
Linear regression (線形回帰) | ツリー数 (常に 1) ノード数 (常に 1) |
|
Naïve Bayes | 重要な属性 | |
ニューラル ネットワーク | 入力ノード数 出力ノード数 隠しノード数 |
|
シーケンス クラスター | クラスターの数 |
完全なレポート
完全なレポートには、概要レポートに含まれるすべての情報と、モデルで使用されるデータの列と分析結果に関する詳細情報が含まれています。
Metadata | モデルのメタデータ | アルゴリズム パラメーターおよび値 |
列のメタデータ | 列名 使用法 データ型 Content type 値 (不連続値の一覧または特定の範囲の値) |
|
モデル統計 | 連続列 | 平均値 最小値 最大値 2 乗平均平方根誤差 平均絶対誤差 ログ スコア 回帰式 (線形回帰モデルのみ)。 |
不連続列 | 合格数 不合格数 ログ スコア リフト |
注意
ドキュメント化できるのは、SQL Server Analysis Services でサポートされている種類のモデルです。 したがって、この表に示されたモデルの中には、テーブル分析ツールまたはデータ マイニング クライアントのウィザードでは作成できない種類のモデルもあります。 ただし、Advanced Data Mining クエリ エディターを使用して、すべてのモデルの種類を作成できます。 詳細については、「クエリ (SQL Server データ マイニング アドイン)」を参照してください。