構造へのモデルの追加 (Excel 用データマイニングアドイン)

[アーティクル]
12/29/2017

[構造にモデルを追加] ボタン [構造

[ 構造にモデルを追加] をクリックすると、既存のマイニング構造で使用する新しいマイニングモデルを作成するのに役立つウィザードが起動します。このオプションは、同じデータに基づくモデルを比較したり、カスタマイズしたモデルを作成したりできるため便利です。

Analysis Services のインスタンスに必要なデータがまだ含まれていない場合は、マイニング構造の作成 (SQL Server データマイニングアドイン) ウィザードを使用してマイニング構造を設定します。または、モデリングウィザードのいずれかを起動してから、ウィザードで作成した構造に新しいモデルを追加することもできます。

ウィザードでサポートされていないアルゴリズムを使用して高度なモデルを作成するには、マイニング構造を作成し、データマイニングの高度なクエリエディターを使用してモデルを追加します。

既存の構造に新しいモデルを追加する

[ データマイニング ] リボンの [ 詳細設定] の下にある矢印をクリックし、[ 構造にモデルを追加] を選択します。
[ 構造の選択 ] ダイアログボックスで、使用するデータを含む構造体を選択し、[ 次へ] をクリックします。

ヒント: 必要なデータが含まれているマイニング構造がわからない場合は、 ドキュメントモデル ウィザードを使用して、データに関する列と基本的な統計情報を表示します。

マイニング構造が見つからない場合は、現在使用している接続をチェックします。別のサーバーへの接続を開く必要がある場合もあります。
[ マイニングアルゴリズムの選択 ] ダイアログボックスで、新しいマイニングモデルで使用するマイニングアルゴリズムを選択します。

ダイアログボックスには、ウィザードに表示されるオプションよりも多くのオプションが用意されています。データに互換性がある場合は、Analysis Services サーバーでサポートされている任意のアルゴリズムを使用してモデルを作成できます。
また、[ パラメーター ] ボタンをクリックして [ アルゴリズムパラメーター ] ダイアログボックスを開き、アルゴリズムのパラメーターをカスタマイズすることをお勧めします。このオプションは、カスタムマイニングモデルを作成する最も簡単な方法です。
[次へ] をクリックします。
[ 列の選択 ] ダイアログボックスで列の一覧を確認し、必要に応じて列の使用法を次のいずれかの値に変更します。
- 入力。列に含まれる変数が結果に影響する可能性があり、モデルへの入力として使用されます。
- 入力と予測。データは入力として使用され、これらの値が予測されます。
- 予測のみ。データはモデルの入力として使用されません。
- [キー] 各モデルには、少なくとも 1 つのキーが必要です。モデルの種類によっては、 SequenceKey や TimeKey などの特別なキーを追加することもできます。
- は使用しないでください。データが構造内に存在してもモデルには使用されません。
参照 (...) ボタンをクリックして、[ 列モデルフラグの設定 ] ダイアログボックスを開きます。

各データ列の使用法がモデルに適切かどうかを確認します。これは、モデルを処理するときに発生するエラーを回避するための重要な手順です。

たとえば、デシジョンツリーモデルに対して作成された構造を再利用して、Naïve Bayes アルゴリズムをこれに適用する場合、データ型が Numeric でコンテンツの種類が Continuous の列はビン分割するか、離散変数に変更する必要があります。

構造内の列が新しいアルゴリズムに適用できない場合は、[ 使用しない] を選択してそれらをバイパスできます。
[ 列モデルフラグの設定 ] ダイアログボックスで、モデリングフラグ (存在する場合) を確認または設定します。

モデリングフラグを使用すると、特に null 値の処理方法を制御できます。詳細については、「モデリングフラグ (データマイニング)」を参照してください。

完了したら [OK] を クリックしてダイアログボックスを閉じます。
[ 完了 ] ダイアログボックスで、新しいマイニングモデルの名前と説明を入力します。

作成したモデルの種類に応じて、次のオプションも表示される場合があります。
- 作成後に完成したマイニングモデルを参照します。
- モデルからソースデータへのドリルスルーを使用します。
  
  詳細については、「マイニングモデルでのドリルスルー」を参照してください。
[完了] をクリックして、変更を保存します。これにより、新しいモデルはサーバーに配置され処理されます。

オプション	説明
[構造またはモデルの選択 ] ダイアログボックス	新しいモデルの作成の基礎として使用する既存のマイニング構造を選択します。選択する構造は、現在の接続にある必要があります。そうでない場合は、ソースデータへの接続 (Excel 用データマイニングクライアント) ツールを使用して接続を変更します。
[マイニングアルゴリズムの選択 ] ダイアログボックス	接続先のサーバーに応じて、データマイニングアルゴリズムの一覧は異なります。 Analysis Services には、Standard エディションと Enterprise エディションのさまざまなアルゴリズムが用意されています。管理者が、カスタムアルゴリズムを追加している場合もあります。アルゴリズムが表示されない場合は、Analysis Services のインスタンスに接続されていることを確認します。
アルゴリズムパラメーターダイアログボックス	これらの設定では、分析メソッドに固有のパラメーターを使用して各アルゴリズムをカスタマイズできます。また、モデルの結果を複数のトレーニングパス間で再現できるようにシードを設定することもできます。詳細については、「アルゴリズムパラメーター (SQL Server データマイニングアドイン)」を参照してください。
列モデルフラグの設定ダイアログボックス	モデリングフラグを使用すると、欠落しているデータの処理方法を指定してモデルを改善できます。詳細については、「モデリングフラグ (データマイニング)」を参照してください。

列の使用法の設定

新しいモデルを既存のマイニング構造に追加する場合は、マイニング構造の各データ列をどのようにモデルで使用するかを指定する必要があります。このウィザードのオプションは、マイニング構造のオプションよりもはるかに詳細であることがわかります。なぜですか?

これは、ウィザードを使用してモデルと構造を一緒に作成すると、アルゴリズムでデータが使用される方法を制御する多くのオプションが自動的に設定されるためです。ただし、既存のモデルに新しいモデルを追加する場合は、これらのオプションを手動で確認し、データを分析に使用するかどうか、データ型が正しいかどうかなどを指定する必要があります。

新しいアルゴリズムを既存のデータに適用すると、エラーメッセージが表示されることがありますが、これらは一般的に、モデルを処理するために必要な修正に関する詳細情報を提供するメッセージです。一般的な問題を次に示します。

モデルがその構造に含まれているデータ型とは異なるデータ型を必要としている。

アルゴリズムには、数字のみを使用できるものや、テキストのみを使用できるものがあります。データが新しいモデルに対して無効な型である場合、モデルで処理できるように構造を変更する必要があります。
マイニング構造に予測可能な属性が含まれていない。

クラスターモデルは予測可能な値を指定せずに作成できますが、その他のモデルは通常、予測に使用する単一列を指定する必要があります。
データの構成は、選択したアルゴリズムと互換性がありません。

分析の種類によっては、一意の規則に従って慎重に構造化されたデータが必要です。例として、予測モデル、アソシエーションモデルなどがあります。たとえば、カスタマイズを行って同じ種類の新しいモデルを簡単に追加できますが、データが他のアルゴリズムでは動作しない場合があります。

要件

データマイニングモデルを作成するには、Analysis Services のインスタンスへの接続が必要です。接続を作成または変更する方法の詳細については、「ソースデータへの接続 (Excel 用データマイニングクライアント)」を参照してください。

必要なデータマイニング構造が表示されない場合は、その構造が別のインスタンスまたは別の Analysis Services データベースに保存されている可能性があります。別のデータマイニング接続に変更する方法については、「データマイニングサーバーへの接続」を参照してください。

参照

データマイニングモデルの作成

次の方法で共有

構造へのモデルの追加 (Excel 用データマイニングアドイン)

既存の構造に新しいモデルを追加する

列の使用法の設定

要件

参照

その他のリソース

次の方法で共有

構造へのモデルの追加 (Excel 用データ マイニング アドイン)

既存の構造に新しいモデルを追加する

関連オプション

列の使用法の設定

要件

参照

その他のリソース

構造へのモデルの追加 (Excel 用データマイニングアドイン)