データ マイニング モデルの作成
データ モデリングは、データにアルゴリズムを適用してパターンと傾向を構築するデータ マイニング の ステップです。 その後、それらのデータを使って追加の分析を行ったり、予測を立てたりすることができます。
Office 用データ マイニング アドインは、ウィザードによるデータ マイニングをサポートすることで、モデルの作成を簡素化しています。 ウィザードでは、データの分析、相関関係の特定、あらゆる変数の統計的有意性の計算、最適なモデルの自動選択が実行されます。
この機能は、SQL Server Analysis ServicesとSQL Server Data Tools (SSDT) によって提供されるデータ マイニング ツールと同じくらい強力ですが、ウィザードと使い慣れた Excel インターフェイスを組み合わせることで、データ マイニングを簡単に作成、変更、使用できます。
詳細設定 (データ マイニング)
高度なウィザードを使用すると、SQL Server Analysis Servicesのいずれかのデータ マイニング アルゴリズムを使用して、Excel に格納されているデータに基づいて新しいデータ マイニング モデルを作成できます。
マイニング構造の作成
マイニング構造の作成ウィザードを使用すると、新しいデータ マイニング構造を構築し、複数のマイニング モデルの基礎として使用できます。 このウィザードには、テスト セットとして使用するデータの一部を確保するオプションが用意されているので、一貫したテスト標準に従って同じデータを使用するすべてのモデルを評価できます。
マイニング構造の作成 (SQL Server データ マイニング アドイン)
構造へのモデルの追加
構造へのモデルの追加ウィザードを使用すると、既存のデータ マイニング構造を選択して、その構造に使用する新しいデータ マイニング モデルを作成できます。 複数のマイニング モデルを構造に追加し、パラメーターを変更するか、別のデータ マイニング アルゴリズムを選択して、出力をカスタマイズできます。
構造へのモデルの追加 (Excel 用データ マイニング アドイン)
主要な影響元の分析 (分析)
目的の列または出力値を選択すると、アルゴリズムがすべての入力データを分析して、対象に最大の影響を与えている要因を特定します。 必要に応じて、2 つの値を比較するレポートを作成できます。これにより、影響元がどのように変化するかを確認できます。
キー インフルエンサーの分析ツールでは、Microsoft Naïve Bayes アルゴリズムを使用します。
アソシエーション (データ マイニング)
関連付けウィザードは、複数のトランザクションに表示されるアイテム間の関連付けを検出する関連付けモデルを構築します。たとえば、市場バスケット分析などです。
アソシエーション ウィザード (Excel 用データ マイニング クライアント)
分類 (データ マイニング)
分類ウィザードは、ターゲットの結果に寄与した要因を分析する分類モデルを構築します。 このウィザードでは、デシジョン ツリー、Naïve Bayes、ニューラル ネットワークを含む複数のアルゴリズムを使用できます。
分類ウィザード (Excel 用データ マイニング アドイン)
クラスター (データ マイニング)
クラスター ウィザードは、同様の特性を共有する行のグループを検出するクラスタリング モデルを構築します。 クラスタリング ( セグメント化とも呼ばれます) は、教師なし学習手法であり、新しいデータのパターンとグループ化を理解する際に非常に役立ちます。
Microsoft クラスタリング アルゴリズムは、K-Means および Expectation Maximization (EM) クラスタリング両方について、複数の種類をサポートします。
クラスター ウィザード (Excel 用データ マイニング アドイン)
カテゴリの検出 (分析)
[カテゴリの検出] ツールを使用すると、任意のデータ セットを追加し、クラスタリングを適用してデータのグループ化を見つけることができます。 類似点を見つける場合や、グループを作成してさらに分析する場合に便利です。
[カテゴリの検出] ツールでは、Microsoft クラスタリング アルゴリズムが使用されます。
推定 (データ マイニング)
推定ウィザードを使用すると、データのパターンを抽出し、そのパターンを基に、連続する数値、日付、または時刻の値を予測する推定モデルを構築できます。 Microsoft デシジョン ツリー アルゴリズムを使用します。
推定ウィザード (Excel 用データ マイニング アドイン)
自動推論 (分析)
[ 例から塗りつぶし] ツールを使用すると、欠損値を補完するのに役立ちます。 不足値の例をいくつか指定すると、このツールはテーブル内のすべてのデータに基づいてパターンを作成し、データのパターンに基づいて新しい値を推奨します。
[例から塗りつぶし] ツールでは、Microsoft ロジスティック回帰アルゴリズムを使用します。
予測 (分析)
予測ツールは、時間の経過と同時に変化するデータを取得し、将来の値を予測します。
予測ツールでは、Microsoft Time Series アルゴリズムが使用されます。
予測 (データ マイニング)
予測ウィザードは、一連のセルのパターンを検出し、追加の値を予測する予測モデルを構築します。
予測ウィザード (Excel 用データ マイニング アドイン)
例外の強調表示 (分析)
例外の強調表示ツールは、データテーブル内のパターンを分析し、パターンに適合しない行と値を検索します。 ユーザーは、これらの値を確認し、修正してモデルを再実行することも、後で処理するためにこれらの値にフラグを設定することもできます。
例外の強調表示ツールでは、Microsoft クラスタリング アルゴリズムが使用されます。
予測計算ツール (分析)
このツールは、目標の結果の達成につながる要因を分析し、これらのパターンから派生した基準に基づいて新しい入力の結果を予測するモデルを作成します。また、新しい入力を簡単にスコアするために役立つ対話形式の意思決定ワークシートを生成します。 ユーザーは、オフラインで使用できるスコアリング ワークシートの印刷バージョンを作成することもできます。
予測計算ツールでは、Microsoft ロジスティック回帰アルゴリズムが使用されます。
シナリオ: ゴール シーク (分析)
ゴール シーク ツールでは、ターゲット値を指定し、そのターゲットを満たすために変更する必要がある基になる要因を特定します。 たとえば、電話対応満足度を 20% 向上させる必要がある場合、その目標を達成するために変更する必要のある要因を予測するようモデルに要求できます。
ゴール シーク ツールでは、Microsoft ロジスティック回帰アルゴリズムが使用されます。
details
ゴール シーク シナリオ (Excel 用のテーブル分析ツール)
シナリオ: What-If シナリオ(分析)
What-If 分析ツールは、ゴール シーク ツールを補完します。 このツールで変更する必要のある値を入力すると、モデルはその変更が目標の結果を達成するために十分であるかどうかを予測します。 たとえば、電話オペレーターを 1 人追加することによって顧客満足度が 1 ポイント向上するかどうかを推測するようモデルに要求できます。
What-If ツールでは、Microsoft ロジスティック回帰アルゴリズムが使用されます。
What-If シナリオ (Excel 用のテーブル分析ツール)
買い物かご分析 (分析)
買い物かご分析ツールは、クロスセリングまたはアップセリングで使用できるパターンを識別するために、頻繁に一緒に購入される製品のグループを作成します。 また、意思決定の際に役立つ、関連する製品バンドルの価格とコストに基づくレポートを生成します。
このツールは、頻繁に同時発生するイベント、診断につながる要因、またはその他の考えられる原因と結果のセットを特定するために使用することもできます。
買い物かご分析ツールは、Microsoft Association アルゴリズムを使用します。
参照
データの探索とクリーニング
モデルの検証と予測用モデルの使用 (Excel 用データ マイニング アドイン)
マイニング モデルの配置とスケーリング (Excel 用データ マイニング アドイン)