次の方法で共有


自動推論 (Excel 用のテーブル分析ツール)

テーブル分析ツールの [例から塗りつぶし] ボタンテーブル分析ツール

[例から塗りつぶし] ツールを使用すると、既存の値に基づいて新しいデータ列を作成できます。

たとえば、データに Purchase Amount 列、 Orders Quantity 列、および他の列を使用する数式に基づく Premier Customer 列が含まれているとします。 Premier Customer 列に多数の空白行が含まれている場合は、入力として Purchase Amount 列と Orders Quantity 列を使用して、欠損値を推測できます。 このツールは、データ内の既存のパターンを、ユーザーが入力したサンプルと組み合わせて分析し、各顧客にどのカテゴリを割り当てるかを予測します。

結果に満足できない場合は、より多くのサンプルを入力することにより、結果の精度を高めることができます。

自動推論ツールの使用

  1. [ 分析 ] リボンで、[ 例から塗りつぶし] をクリックします。

  2. 挿入対象となる列は、データの分析に基づいて自動的に選択されますが、それを受け入れるか、別の列を選択するかはユーザーが判断できます。

  3. 新しいデータの列を作成し、予測したいデータのサンプルを入力します。 予測する値ごとに、少なくとも 1 つのサンプル データが必要です。 既存の列にデータを挿入する場合は、欠損値の存在する列を選択します。

  4. 必要に応じて、[ 分析に使用する列の選択] をクリックします。 [ 高度な列の選択 ] ダイアログ ボックスで、不足しているデータを入力するときに役立つ可能性が最も高い列を指定します。

    たとえば、欠損値の存在する列との間に因果効果のある列が経験的にわかっている場合は、他の列の選択を解除することによって、より精度の高い結果を得ることができます。

    [OK] をクリックします。

  5. [実行] をクリックします。

    分析が完了すると、分析の結果を含む新しい パターン ワークシートが作成されます。 レポートには、見つかったルール (主要な影響元) が一覧表示され、各ルールの確率が表示されます。

    また、新しい値を含む列が、元のデータ テーブルに自動的に追加されます。 挿入された値を元の状態と比較しながら確認できます。

要件

処理できるのは、列方向に格納されたデータだけです。 自動推論によって挿入する一連のデータが行として格納されている場合は、Excel の Paste、Transpose 関数を使用して、データを列形式に変換できます。

パターン レポートについて

[例から塗りつぶし] ツールを実行すると、検出されたパターンに関する詳細情報を提供するレポートが作成されます。 これらのパターンは、新しいデータ値を推定するときに使用されます。

パターン レポートには、予測された値ごとに主要な影響元が示されます。 個々の影響元 (ルール) は、列とその値、および、そのルールの予測に対する相対的影響として表されます。

たとえば、注文の配送距離が記されたワークシートに対してデータを挿入しようとする場合、配送距離に強く影響するのは、配送先となる目的地です。 この場合、レポートには、次のような行が表示されます。

[値] 好意 相対的影響
StateProvinceCode AB >500 キロメートル 80%

つまり、 StateProvinceCode 列の値 AB は、出荷距離 >500 キロメートルを強く予測します。

通常、ここで示した例よりも、はるかに複雑なパターンに基づいて予測が行われます。したがって、予測ごとに出力されるルールの行数も、もっと多くなります。 予測値は、こうしたすべてのルールの影響を組み合わせることによって導かれます。

注意

相対影響 は影付きバーとして表示されます。 棒グラフが長いほど、そのルールが、適切な挿入値を予測できる確率が高いことを示します。

また、このツールは、元のデータ テーブルに新しい列を追加し、列名> Extended という名前<を付けます。

元のデータ列に値が存在した場合、その値が、この新しい列にコピーされます。 ただし、元の列が空白セルであった場合、新しい列には、ウィザードによって予測された値が格納されます。

また、Excel 用データ マイニング クライアントで使用できる [データの探索 ] ウィザードを使用して、Excel 列の値の分布を調べることもできます。 詳細については、「 データの探索とクリーニング」を参照してください。

参照

Excel 用テーブル分析ツール