次の方法で共有


例外の強調表示 (Excel 用のテーブル分析ツール)

リボンの [例外の強調表示] ボタン リボンの

時には、データに例外的な値が含まれる場合があります。 たとえば、住宅所有者の年齢が "5 歳" と表示されているとします。 これらの値は、多くの場合、 外れ値と呼ばれ、データ入力エラーのために間違っている可能性があります。または、異常な傾向を示している可能性があります。 どちらにしても、例外は分析の質に影響する可能性があります。 例外の強調表示ツールを使用すると、これらの値を見つけて、さらにアクションを確認できます。

例外の強調表示ツールは、Excel データ テーブル内のデータの範囲全体を操作することも、少数の列のみを選択することもできます。 しきい値を変更してデータの揺れを考慮し、検出する例外の数を調整することもできます。

例外の強調表示ツールでは分析が完了すると新しいワークシートが作成され、分析対象の各列に見つかった外れ値の数を示すサマリー レポートが出力されます。 また、元のデータ テーブルに存在する例外も強調表示されます。 このツールでは、全体の傾向が分析されるため、特定の行のほとんどの値は通常値で、その行の単一のセルだけが強調表示される、ということもあります。 上の住宅所有者の例では、[ 年齢 ] 列のみが強調表示されている可能性があります。

概要レポート例外しきい値を変更することもできます。 この値は、特定のセルに外れ値が含まれる確率を示します。 したがって、しきい値を上げることにより、外れ値として強調表示される値の数が減ります。 逆に、しきい値を下げた場合、強調表示されるセルの数は増えます。

例外の強調表示ツールの使用

  1. Excel テーブルを開き、[ 例外の強調表示] をクリックします。

  2. 分析する列を指定します。

  3. [実行] をクリックします。

  4. テーブル名> [外れ値] というタイトル<のワークシートを開き、見つかった外れ値の概要を表示します。

  5. 強調表示の数を変更するには、[例外の強調表示] レポートの [例外しきい値] 行の上下の矢印をクリックします。

要件

外れ値が含まれていない列でも、その値が他の行の予測に貢献するのであれば、検出対象に含めることができます。 しかし、欠損値をあまりにも多く含む列については、選択を解除する必要があります。

選択したすべての列が、一般的なパターンの作成に使用されるので、次のような適切でない情報を含む入力列は使用しないようにしてください。

  • ID などの一意な値を含む列。

  • 間違った値の割合が高い列。

  • 欠損値が多い列。

    欠損値が多い列を入力列として含めると有効な場合もあります。 たとえば、小売り店で顧客が買い物をしたときに必ず住所フィールドの値が欠落する場合は、データ マイニング アルゴリズムはこの情報を使用して他の類似の顧客を識別することができます。 データが省略によって欠落しているのか、それとも欠落状態に意味があるのかを、ケースごとに判断する必要があります。

  • パターンの作成にほとんど役立たない列。 たとえば、すべての行の値が同じである列は、パターンの作成に役立つ情報となりません。

例外の強調表示レポートについて

[ 実行] をクリックすると、ツールによって次の 3 つの処理が実行されます。

  • テーブル内の最新のデータに基づいてデータ マイニング構造を作成する。

  • Microsoft クラスタリング アルゴリズムを使用して、新しいデータ マイニング モデルを作成します。

  • パターンに基づく予測クエリを作成し、ワークシートに、あり得ない値が存在するかどうかを調べる。

例外のしきい値の初期値は常に 75 になります (つまり、75% の確率でデータに誤りがあるとアルゴリズムが計算した場合に、そのデータが強調表示されます)。 初回分析パスについては、このしきい値が自動的に設定されますが、レポートで値を変更することもできます。

[例外の強調表示] ツールは、疑わしい元のデータ テーブル内のセルを強調表示します。 注意を要する行は、濃い色で強調表示されます。 特定のセルの値が異常値として検出された場合は、明るい色で強調表示されます。 例外のしきい値を変更すると、それに応じて強調表示される値も変わります。

サマリー グラフには、例外のしきい値を超えたセルの数が列単位で表示されます。

データ マイニングに備えてデータを消去または確認する段階で、Excel 用のデータ マイニング クライアントのデータ探索機能を利用することもできます。 このアドインには、外れ値を検出したり、データのラベルを変更したり、データの分布を確認したりするための、より高度なツールが用意されています。 Excel 用データ マイニング クライアントのデータ探索ツールの詳細については、「データの 探索とクリーニング」を参照してください。

例外の強調表示ツールでは、Microsoft クラスタリング アルゴリズムが使用されます。 クラスター モデルにより、似た特性を共有する行グループが検出されます。 Excel 用データ マイニング クライアントには、グラフと特性プロファイルを使用してクラスタリングによって作成されたデータ マイニング モデルを探索できる [参照 ] ウィンドウが用意されています。 例外の強調表示ツールによって作成されたクラスタリング モデルを参照する方法については、「Browse Models (Data Mining Client for Excel)」を参照してください。

Microsoft クラスタリング アルゴリズムの詳細については、オンライン ブックの「Microsoft クラスタリング アルゴリズム」SQL Server参照してください。

参照

Excel 用テーブル分析ツール