構造へのモデルの追加 (Excel 用データ マイニング アドイン)
[ 構造にモデルを追加] をクリックすると、既存のマイニング構造で使用する新しいマイニング モデルを作成するのに役立つウィザードが起動します。 このオプションは、同じデータに基づくモデルを比較したり、カスタマイズしたモデルを作成したりできるため便利です。
Analysis Services のインスタンスに必要なデータがまだ含まれていない場合は、マイニング構造の作成 (SQL Server データ マイニング アドイン) ウィザードを使用してマイニング構造を設定します。 または、モデリング ウィザードのいずれかを起動してから、ウィザードで作成した構造に新しいモデルを追加することもできます。
ウィザードでサポートされていないアルゴリズムを使用して高度なモデルを作成するには、マイニング構造を作成し、データ マイニングの高度なクエリ エディターを使用してモデルを追加します。
既存の構造に新しいモデルを追加する
[ データ マイニング ] リボンの [ 詳細設定] の下にある矢印をクリックし、[ 構造にモデルを追加] を選択します。
[ 構造の選択 ] ダイアログ ボックスで、使用するデータを含む構造体を選択し、[ 次へ] をクリックします。
ヒント: 必要なデータが含まれているマイニング構造がわからない場合は、 ドキュメント モデル ウィザードを使用して、データに関する列と基本的な統計情報を表示します。
マイニング構造が見つからない場合は、現在使用している接続をチェックします。 別のサーバーへの接続を開く必要がある場合もあります。
[ マイニング アルゴリズムの選択 ] ダイアログ ボックスで、新しいマイニング モデルで使用するマイニング アルゴリズムを選択します。
ダイアログ ボックスには、ウィザードに表示されるオプションよりも多くのオプションが用意されています。 データに互換性がある場合は、Analysis Services サーバーでサポートされている任意のアルゴリズムを使用してモデルを作成できます。
また、[ パラメーター ] ボタンをクリックして [ アルゴリズム パラメーター ] ダイアログ ボックスを開き、アルゴリズムのパラメーターをカスタマイズすることをお勧めします。 このオプションは、カスタム マイニング モデルを作成する最も簡単な方法です。
[次へ] をクリックします。
[ 列の選択 ] ダイアログ ボックスで列の一覧を確認し、必要に応じて列の使用法を次のいずれかの値に変更します。
入力。 列に含まれる変数が結果に影響する可能性があり、モデルへの入力として使用されます。
入力と予測。 データは入力として使用され、これらの値が予測されます。
予測のみ。 データはモデルの入力として使用されません。
[キー] 各モデルには、少なくとも 1 つのキーが必要です。 モデルの種類によっては、 SequenceKey や TimeKey などの特別なキーを追加することもできます。
は使用しないでください。 データが構造内に存在してもモデルには使用されません。
参照 (...) ボタンをクリックして、[ 列モデル フラグの設定 ] ダイアログ ボックスを開きます。
各データ列の使用法がモデルに適切かどうかを確認します。 これは、モデルを処理するときに発生するエラーを回避するための重要な手順です。
たとえば、デシジョン ツリー モデルに対して作成された構造を再利用して、Naïve Bayes アルゴリズムをこれに適用する場合、データ型が
Numeric
でコンテンツの種類がContinuous
の列はビン分割するか、離散変数に変更する必要があります。構造内の列が新しいアルゴリズムに適用できない場合は、[ 使用しない] を選択してそれらをバイパスできます。
[ 列モデル フラグの設定 ] ダイアログ ボックスで、モデリング フラグ (存在する場合) を確認または設定します。
モデリング フラグを使用すると、特に null 値の処理方法を制御できます。 詳細については、「 モデリング フラグ (データ マイニング)」を参照してください。
完了したら [OK] を クリックしてダイアログ ボックスを閉じます。
[ 完了 ] ダイアログ ボックスで、新しいマイニング モデルの名前と説明を入力します。
作成したモデルの種類に応じて、次のオプションも表示される場合があります。
作成後に完成したマイニング モデルを参照します。
モデルからソース データへのドリルスルーを使用します。
詳細については、「 マイニング モデルでのドリルスルー」を参照してください。
[完了] をクリックして、変更を保存します。 これにより、新しいモデルはサーバーに配置され処理されます。
関連オプション
オプション | 説明 |
---|---|
[構造またはモデルの選択 ] ダイアログ ボックス | 新しいモデルの作成の基礎として使用する既存のマイニング構造を選択します。 選択する構造は、現在の接続にある必要があります。 そうでない場合は、 ソース データへの接続 (Excel 用データ マイニング クライアント) ツールを使用して接続を変更します。 |
[マイニング アルゴリズムの選択 ] ダイアログ ボックス | 接続先のサーバーに応じて、データ マイニング アルゴリズムの一覧は異なります。 Analysis Services には、Standard エディションと Enterprise エディションのさまざまなアルゴリズムが用意されています。 管理者が、カスタム アルゴリズムを追加している場合もあります。 アルゴリズムが表示されない場合は、Analysis Services のインスタンスに接続されていることを確認します。 |
アルゴリズム パラメーター ダイアログ ボックス | これらの設定では、分析メソッドに固有のパラメーターを使用して各アルゴリズムをカスタマイズできます。 また、モデルの結果を複数のトレーニング パス間で再現できるようにシードを設定することもできます。 詳細については、「アルゴリズム パラメーター (SQL Server データ マイニング アドイン)」を参照してください。 |
列モデル フラグの設定 ダイアログ ボックス | モデリング フラグを使用すると、欠落しているデータの処理方法を指定してモデルを改善できます。 詳細については、「 モデリング フラグ (データ マイニング)」を参照してください。 |
列の使用法の設定
新しいモデルを既存のマイニング構造に追加する場合は、マイニング構造の各データ列をどのようにモデルで使用するかを指定する必要があります。 このウィザードのオプションは、マイニング構造のオプションよりもはるかに詳細であることがわかります。 なぜですか?
これは、ウィザードを使用してモデルと構造を一緒に作成すると、アルゴリズムでデータが使用される方法を制御する多くのオプションが自動的に設定されるためです。 ただし、既存のモデルに新しいモデルを追加する場合は、これらのオプションを手動で確認し、データを分析に使用するかどうか、データ型が正しいかどうかなどを指定する必要があります。
新しいアルゴリズムを既存のデータに適用すると、エラー メッセージが表示されることがありますが、これらは一般的に、モデルを処理するために必要な修正に関する詳細情報を提供するメッセージです。 一般的な問題を次に示します。
モデルがその構造に含まれているデータ型とは異なるデータ型を必要としている。
アルゴリズムには、数字のみを使用できるものや、テキストのみを使用できるものがあります。 データが新しいモデルに対して無効な型である場合、モデルで処理できるように構造を変更する必要があります。
マイニング構造に予測可能な属性が含まれていない。
クラスター モデルは予測可能な値を指定せずに作成できますが、その他のモデルは通常、予測に使用する単一列を指定する必要があります。
データの構成は、選択したアルゴリズムと互換性がありません。
分析の種類によっては、一意の規則に従って慎重に構造化されたデータが必要です。 例として、予測モデル、アソシエーション モデルなどがあります。 たとえば、カスタマイズを行って同じ種類の新しいモデルを簡単に追加できますが、データが他のアルゴリズムでは動作しない場合があります。
要件
データ マイニング モデルを作成するには、Analysis Services のインスタンスへの接続が必要です。 接続を作成または変更する方法の詳細については、「 ソース データへの接続 (Excel 用データ マイニング クライアント)」を参照してください。
必要なデータ マイニング構造が表示されない場合は、その構造が別のインスタンスまたは別の Analysis Services データベースに保存されている可能性があります。 別のデータ マイニング接続に変更する方法については、「 データ マイニング サーバーへの接続」を参照してください。