推定ウィザード (Excel 用データ マイニング アドイン)
見積もりウィザードを使用すると、推定モデルを作成できます。 推定モデルは、データからパターンを抽出し、そのパターンを使用して結果に影響を与える要因を予測します。
推定は数値の結果を予測するために使用されます。 たとえば、教育機関の卒業率をパーセンテージで表した値が対象列に格納されている場合、教育機関ごとの生徒数、生徒と教員の比率、教員数など、卒業率の増減に関係する可能性がある要因を分析できます。
データ推定ウィザードの使用
[ データ マイニング ] リボンの [ 見積もり] をクリックします。
[ ソース データの選択 ] ダイアログ ボックスで、使用するソース データを選択します。 Excel テーブル、Excel データ範囲、または 外部データ ソースのデータを使用できます。
外部データ ソースを使用する場合は、カスタム ビューまたはクエリを作成し、Analysis Services データ ソースとして保存できます。
[ 推定 ] ダイアログ ボックスで、 分析する列を選択します。
対象列には、連続する数値データが格納されている必要があります。
[入力列] チェック ボックスをオンにして、入力として使用する 列 を選択します。
選択した列は、パターンの作成に使用されます。 分析には不要と思われる ID 番号などの列や、分析とは無関係なデータを含んだ列は、除外する必要があります。
推定ウィザードでは、データ セットに最適なアルゴリズムが選択されます。 ただし、[ パラメーター ] をクリックして [ アルゴリズム パラメーター ] ダイアログ ボックスを開き、詳細オプションを設定できます。
データが数値で、Microsoft 線形回帰メソッドを使用できる場合は、予測可能な値と関連付けられていることがわかっている (または強く疑わしい) 数値列の [リグレッサー] ボックスをチェックできます。
そうすると、アルゴリズムによって、その列の値がテストされ、値が出力に影響するかどうかが判断されます。 不明な場合は、[ 提案 ] をクリックすると、アルゴリズムによってすべての列がテストされ、リグレッサーとして使用する最適な値が自動的に検出されます。
注意
推定を作成するにはリグレッサーが必要です。 ウィザードでは、データに対する最初のパスに基づいて、常に最適なリグレッサーが提示されます。 このため、どれを選択すればよいかわからない場合は、推奨された選択内容を使用することをお勧めします。
[ データをトレーニング セットとテスト セットに分割 する] ページで、テスト用にデータの小さなサブセットを作成するかどうかを指定します。
[ 完了 ] ページで、新しいマイニング構造とマイニング モードの名前を指定するか、指定された既定の名前をそのまま使用します。
モデルを使用するためのオプションを設定します。
[ 参照] を 選択して、すぐにビューアーでモデルを開きます。
このグラフィカルなビューアーには、依存関係ネットワーク グラフやアルゴリズムによって生成されたデジション ツリーなどが表示されます。 この情報を調査することで、推測値をもたらした要因をより深く理解できます。
[ ドリルスルーを有効にする] を選択 して、分析のユーザーが基になるデータを表示できるようにします。
このオプションを使用できるのは、デシジョン ツリー アルゴリズムまたは線形回帰アルゴリズムを使用する場合だけです。
一時モデルを使用します。 このチェック ボックスをオンにすると、モデルがサーバーに保存されません。 一時的なモデルは、Excel の終了時に削除されます。
推定モデルの詳細
見積もりウィザードでは、次のいずれかのアルゴリズムの使用がサポートされています。
Microsoft デシジョン ツリー アルゴリズム
Microsoft 線形回帰アルゴリズム
Microsoft ロジスティック回帰アルゴリズム
Microsoft ニューラル ネットワーク アルゴリズム
[ アルゴリズム パラメーター] ダイアログ ボックスでは、選択したアルゴリズムに応じて、追加の詳細オプションを設定できます。 各アルゴリズムのオプションの詳細については、SQL Server オンライン ブックの次のトピックを参照してください。
Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス
Microsoft 線形回帰アルゴリズム テクニカル リファレンス
Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス
Microsoft Neural Network Algorithm Technical Reference
要件
データの見積もりウィザードを使用するには、Analysis Services データベースに接続されている必要があります。
接続を作成する方法の詳細については、「 ソース データへの接続 (Excel 用データ マイニング クライアント)」を参照してください。
推定アルゴリズムを使用するには、予測しようとしている結果を、通貨、売上高、日付、時刻などの数値で表す必要があります。