Excel 用のデータ マイニング クライアント (SQL Server データ マイニング アドイン)
Excel 用データ マイニング クライアントは、データ クレンジング、モデル構築、予測クエリなど共通のデータ マイニング タスクを実行できる一連のツールです。 Excel テーブルまたは範囲のデータを使用することも、外部データ ソースにアクセスすることもできます。
-
Excel にデータを読み込み、データをクレンジングし、外れ値をチェックし、統計の概要を作成します。 また、さまざまな種類のサンプリング、データのプロファイル、外部データを使用したモデルのテストも実行できます。 データ マイニング クライアントは、分析するデータを複雑なスクリプトや ETL プロセスなしで準備する最も簡単な方法です。
-
これらのツールが提供するウィザード インターフェイスから、クラスタリング (K-Means および EM)、アソシエーション分析、時系列分析、デシジョン ツリーなど、広く普及した実証済みのデータ マイニング アルゴリズムを利用できます。 各ウィザードの詳細モデリング オプションでは、Naïve Bayes やニュートラル ネットワークなど、異なるアルゴリズムを選択することができ、クラスター シードや初期サンプリング サイズなどの動作をカスタマイズできます。
すべてのデータ マイニング アルゴリズムは Analysis Services のインスタンスでホストされるため、複雑なモデルを構築する能力が高くなります。
-
データ マイニング クライアントには、リフト チャートやクロス検証も含めて、モデルをテストする業界標準のツールが用意されています。 用意されているウィザードを使用すると、データセットの有効性と精度を容易にテストできます。 クエリ ウィザードでは、予測およびスコアリングのためにモデルを使用するクエリを作成します。
-
ほとんどのツールが生成するチャートは Excel に直接保存できます。 Excel でのモデルの参照 (SQL Server データ マイニング アドイン) ツールを使用して、モデルを探索します。
-
Excel 用のデータ マイニング クライアントではサーバーへのアクティブな接続が維持されるので、作成したデータ マイニング モデルをサーバーに保存して以降のテストで使用できます。または、モデルを実稼働サーバーに保存するとスケーラビリティはさらに高くなります。
データの操作
データ準備グループには、データ マイニング タスクに備えてデータを確認してクリーンするのに役立つ次のウィザードが含まれています。 また、ほとんどのウィザードでデータをトレーニング セットとテスト セットに分けることができます。
データの探索 (SQL Server データ マイニング アドイン)
このアドインでは、モデルの構築と格納用に次のデータ接続をサポートしています。
モデルを格納および処理するための Analysis Services サーバーへの接続。
外部データ ソースへの接続 (オプション)。 Analysis Services データ ソースとして定義できる任意の種類のデータを使用してモデルを構築することも、Excel に既に存在するデータを使用することもできます。
データの探索 (SQL Server データ マイニング アドイン)
データの探索ウィザードは、選択した列の分布と値を 1 つずつグラフ化することで、データ テーブル内のデータの種類と量を理解するのに役立ちます。
サンプル データ (SQL Server データ マイニング アドイン)
モデルのトレーニングとテストのために適切なデータを作成する作業は、データ マイニングの重要な部分ですが、適切なツールがないと面倒になりがちです。 サンプル データ ウィザードを使用すると、モデルに使用されるデータを 2 つのグループに簡単に分割できます。1 つはモデルを構築するためのグループと、モデルをテストするためのグループです。 ランダム サンプリングまたはオーバーサンプリングを使用できます。
予測計算 (Excel 用のテーブル分析ツール)
外れ値の削除ウィザードには、外れ値を識別して適切に処理するためのツールがいくつか用意されています。 このウィザードでは、値の分布や外れ値とその他のデータのリレーションシップを表示して、外れ値の削除または変更を判断できます。
予測計算 (Excel 用のテーブル分析ツール)
ラベルの変更ウィザードを使用すると、データの新しいラベルを作成して、分析結果を理解しやすくなります。 たとえば、データの範囲の名前をよりわかりやすい名前に変更したり、一覧から代表値を選択したりすることができます。
モデルの構築と分析
ツール バーの [ データ モデリング ] セクションのオプションを使用すると、データからパターンを派生させることができます。属性に基づいてデータ行をグループ化するか、関連付けを調べる。 このツール リボンのウィザードは、Analysis Services で使用できる強力なデータ マイニング アルゴリズムに基づいています。 Excel 用のテーブル分析ツールの類似ツールと異なり、これらのウィザードでは、アルゴリズムの動作をカスタマイズしたり、さまざまなデータ ソースを使用したりできます。
分類ウィザード (Excel 用データ マイニング アドイン)
分類ウィザードは、Excel テーブル、Excel 範囲、または外部データ ソース内の既存のデータに基づいて分類モデルを構築するのに役立ちます。 分類モデルはデータから共通のパターンを抽出します。そのため、分類モデルを使用すると、グループ化された値に基づいて予測を行うことができます。 たとえば、分類モデルを使用して、収入パターンまたは支出パターンに基づくリスクを予測できます。
分類ウィザードでは、次の Microsoft データ マイニング アルゴリズム (デシジョン ツリー アルゴリズム、ロジスティック回帰、Naïve Bayes、ニューラル ネットワーク) の使用がサポートされています。
推定ウィザード (Excel 用データ マイニング アドイン)
推定ウィザードを使用すると、推定モデルを作成できます。 推定モデルは、データからパターンを抽出し、そのパターンを基に、通貨、売上高、日付、時刻など数値による結果を予測します。
推定ウィザードでは、次の Microsoft データ マイニング アルゴリズム (デシジョン ツリー、線形回帰、ロジスティック回帰、ニューラル ネットワーク) が使用されます。
主要な影響元の分析 (Excel 用のテーブル分析ツール)
クラスター ウィザードでは、クラスター モデルを構築できます。 クラスター モデルにより、似た特性を共有する行グループが検出されます。 このウィザードは、あらゆる種類のデータのパターンを調べる場合に有用です。
クラスター ウィザードでは、K 平均と EM の両方を含む Microsoft クラスタリング アルゴリズムが使用されます。
アソシエーション ウィザード (Excel 用データ マイニング クライアント)
関連付けウィザードは、頻繁に発生するアイテムまたはイベントを検出する Microsoft 関連付けルール アルゴリズムを使用してデータ マイニング モデルを作成するのに役立ちます。 このようなアソシエーション モデルは、特定のアイテムを推薦する場合などに特に有用です。
関連付けウィザードでは、Microsoft 関連付けルール アルゴリズムを使用します。
予測ウィザード (Excel 用データ マイニング アドイン)
予測ウィザードは、時系列の値を予測するのに役立ちます。 通常、予測で使用されるデータには日付スタンプやシーケンス ID など、ある種の時系列が含まれます。この時系列を使用して抽出したパターンを使用して将来値を予測します。
予測ウィザードでは、Microsoft Time Series アルゴリズムが使用されます。
高度なモデリング (Excel 用データ マイニング アドイン)
データ マイニングの概念を既に理解している場合は、 [高度なデータ モデリング] オプションを使用すると、カスタム データ構造を作成し、他のツールやウィザードに含まれていないカスタマイズを使用してモデルを構築できます。
モデルのテスト、クエリ、および検証
[精度と検証] ツール バーのウィザードを使用して、モデルの精度を検証したり、モデルを作成するためのデータ セットの実行可能性を評価したりするための業界標準のテストを使用します。
主要な影響元の分析 (Excel 用のテーブル分析ツール)
リフト チャートまたは散布図を生成することにより、データ マイニング モデルのパフォーマンスを評価します。
分類マトリックス (SQL Server データ マイニング アドイン)
モデルによって生成される正確な予測と不正確な予測の概要グラフを作成することにより、分類モデルのパフォーマンスを評価できます。
利益チャート (SQL Server データ マイニング アドイン)
予測に基づいてアクションを実行した場合のコストと利点を含め、予測の精度をグラフ化することにより、データ マイニング モデルの影響について理解できます。
クロス検証 (SQL Server データ マイニング アドイン)
データセットの多数のサブセットにわたってモデルの正確性を要約したレポートを作成することにより、モデルの安定度を判断できます。
また、サーバーに格納されているマイニング モデルに対する予測クエリの入力として、Excel テーブルのデータを使用することもできます。
クエリ (SQL Server データ マイニング アドイン)
クエリ ウィザードは、既存のデータ マイニング モデルに対する予測を作成するのに役立ちます。
詳細データ マイニング クエリ エディター
このツールは、上級ユーザー向けに DMX へのドラッグ アンド ドロップ インターフェイスを提供します。 予測クエリまたは新しいモデルを簡単に作成でき、構文について心配する必要はありません。
モデルの表示
作成するモデルは参照用に自動的に開きます。 ただし、サーバー上でモデルを参照して、新しい視覚エフェクトを生成することもできます。 Visio 図形を使用して、モデルダイアグラムをカスタマイズ可能なキャンバスにエクスポートします。
Excel におけるモデルの参照 (SQL Server データ マイニング アドイン)
モデルの各種類に合わせてカスタマイズされた対話型のグラフを使用して、作成したモデルを表示します。
マイニング モデルのドキュメント化とスケーリング (Excel 用データ マイニング アドイン)
このウィザードでは、データ セットとモデルのメタデータに関する統計サマリーを提供するレポートが作成されます。このレポートを調査と解釈に役立てることができます。
管理、ドキュメント化、配置
これらのツールを使用することで、データ マイニング サーバーに接続し、モデルを管理およびエクスポートして、データ マイニング アクティビティを監視できます。
モデルの管理 (SQL Server データ マイニング アドイン)
必要なアクセス許可がある場合は、Excel から離れることなく、既存のマイニング モデルや構造を削除、名前変更、または処理できます。
トレース (Excel 用のデータ マイニング クライアント)
[トレース] をクリックして、Excel クライアントとSQL Server サーバー間の相互作用の進行中のキャプチャを表示します。 アクティビティはすべて DMX または XMLA ステートメントとして格納されるため、データ マイニング セッションのトラブルシューティングを行ったり、後で使用するために情報を保存したりできます。
データ マイニング サーバーへの接続
Excel をデータ マイニングのクライアントとして使用するには、Analysis Services のインスタンスへの接続を確立する必要があります。 接続により、Analysis Services エンジンにアクセスできます。 また、適切な権限を持っている場合は、この接続により、発見したパターンの格納や、既存のデータ マイニング オブジェクトの変更を行うこともできます。
[接続] ツール バーには、Analysis Services のインスタンスへの接続を管理するためのウィザードが用意されています。 データ マイニング ツールとアルゴリズムを使用するには、Analysis Services のインスタンスへの接続を定義する必要があります。 アドインをインストールするときに接続を作成できます。後で接続を追加することもできます。
はじめに
[はじめに] ボタンをクリックして、Analysis Services のインスタンスへの接続を作成し、データ マイニングを実行するために必要なアクセス許可を取得するプロセスを示す構成ウィザードを開始します。
ヘルプ
[ ヘルプ ] ドロップダウン メニューには、セットアップの完了とデータ マイニングの開始に役立つオンライン ヘルプ、Web サイト、および構成ウィザードへのリンクが表示されます。
ヘルプ ページには、アドインのヘルプ、追加のビデオ、デモ、サンプルなどのオンライン リソースへのリンクも記載されています。
参照
Excel 用テーブル分析ツール
Visio データ マイニング図形のトラブルシューティング (SQL Server データ マイニング アドイン)