コール センター モデルの検証 (中級者向けデータ マイニング チュートリアル)
探索的モデルを構築したら、SQL Server Data Tools (SSDT) で提供されている次のツールを使用して、探索的モデルを使用してデータの詳細を確認できます。
Microsoft ニューラル ネットワーク ビューアー : このビューアーは、データ マイニング デザイナーの Mining Model Viewer タブで使用でき、データの相互作用を試すのに役立ちます。
Microsoft 汎用コンテンツ ツリー ビューアー : この標準ビューアーでは、モデルの生成時にアルゴリズムによって検出されたパターンと統計について詳しく説明します。
Microsoft ニューラル ネットワーク ビューアー
ビューアーには、 Input、 Output、 Variables の 3 つのペインがあります。
Output ペインを使用すると、予測可能な属性または従属変数に異なる値を選択できます。 モデルに複数の予測可能な属性が含まれている場合は、 Output 属性 一覧から属性を選択できます。
Variables ペインでは、属性または変数の観点から選択した 2 つの結果が比較されます。 色分けされたバーは、対象となる結果に対し、変数がどの程度強く影響を与えているかを視覚的に表します。 変数のリフト スコアを表示することもできます。 リフト スコアは、使用しているマイニング モデルの種類によって計算方法が異なりますが、一般には、予測にこの属性を使用した場合のモデルの改善状況を示します。
Input ペインを使用すると、モデルにインフルエンサーを追加して、さまざまな what-if シナリオを試すことができます。
[出力] ペインの使用
この初期モデルでは、サービスのグレードに対して各種の要因がどのように影響を及ぼしているかを調べます。 これを行うには、出力属性の一覧からサービス グレードを選択し、 Value 1 と Value 2 のドロップダウン リストから範囲を選択して、さまざまなレベルのサービスを比較できます。
最低と最高のサービス グレードを比較するには
Value 1の場合は、最小値を持つ範囲を選択します。 たとえば、0 ~ 0.07 の範囲は、最低の電話放棄呼率 (つまり、最高のサービス水準) を表します。
Note
この範囲に含まれる厳密な値は、モデルの構成方法によって異なる場合があります。
Value 2では、最大値を持つ範囲を選択します。 たとえば、値が >=0.12 の範囲は、破棄率が最も高く、サービス グレードが最も悪い値を表します。 つまり、このシフト中に電話をかけてきた顧客の 12% が、担当者が応対する前に電話を切ったことになります。
Variables ペインの内容が更新され、結果の値に寄与する属性が比較されます。 左側の列は、最高グレードのサービスに関連付けられている属性を表し、右側の列は、最低グレードのサービスに関連付けられている属性を表します。
[変数] ペインの使用
このモデルでは、 Average Time Per Issue
が重要な要素であるようです。 この変数は、問い合わせの種類に関係なく、問い合わせから回答までに要した平均時間を示します。
属性の確率スコアとリフト スコアを表示およびコピーするには
Variables ペインで、最初の行の色付きのバーの上にマウス ポインターを置きます。
この色付きのバーは、
Average Time Per Issue
がサービス グレードにどの程度貢献しているかを示しています。 ツールヒントには、変数と対象となる結果の組み合わせごとに、全体的なスコア、確率、およびリフト スコアが表示されます。Variables ペインで、色付きのバーを右クリックし、Copy を選択します。
Excel ワークシートで任意のセルを右クリックし、 Paste を選択します。
レポートが HTML テーブルとして貼り付けられ、各バーのスコアだけが表示されます。
別の Excel ワークシートで、任意のセルを右クリックし、 Paste Special を選択します。
レポートがテキスト形式で貼り付けられ、関連する統計 (次のセクションで説明) が表示されます。
[入力] ペインの使用
シフトやオペレーターの人数など、特定の要因の影響を調べているとします。 Input ペインを使用して特定の変数を選択すると、Variables ペインが自動的に更新され、指定した変数に指定された 2 つのグループが比較されます。
入力属性を変更することによってサービス グレードへの影響をレビューするには
Input ペインで、attribute Shift キーを押します。
Valueで、[
AM を選択します。Variables ペインが更新され、シフトがAMしたときのモデルへの影響が表示されます。 他のすべての選択は同じままです。サービス グレードが最も低く、最も高いものを比較しています。
Value で、PM1 を選択します。
Variables ペインが更新され、シフトが変更されたときのモデルへの影響が表示されます。
Input ペインで、Attribute の下にある次の空白行をクリックし、[呼び出し] を選択します。 Valueで、呼び出しの最大数を示す範囲を選択します。
リストに新しい入力条件が追加されます。 Variables ペインが更新され、呼び出し量が最も多い場合の特定のシフトのモデルへの影響が表示されます。
[シフト] および [問い合わせ] の値を変更しながら、シフト、問い合わせ件数、およびサービス グレードの間に、何か相関関係がないか見極めます。
Note
Input ペインをクリアして、さまざまな属性を使用できるようにするには、[ビューアーのコンテンツ表示をクリックします。
ビューアーに表示される統計の解釈
待ち時間が長ければ、電話放棄呼率が高くなり、サービス グレードも低下します。 当然の結果のようにも見えますが、マイニング モデルは、その傾向を読み解くための補足的な統計データをいくつか提供します。
Score: 結果を区別するためのこの変数の全体的な重要度を示す値。 スコアが高いほど、その変数が結果に及ぼす影響は強くなります。
値 1 の確率: この結果に対するこの値の確率を表す割合。
値 2 の確率: この結果に対するこの値の確率を表す割合。
値 1 のリフト と値 2 の リフト: 値 1 と値 2 の結果を予測するためにこの特定の変数を使用した場合の影響を表すスコア。 スコアが高いほど、その変数を使って、効果的に結果を予測することができます。
次の表に、トップ インフルエンサについて、いくつかの値の例を示します。 たとえば、値 1 の Probability は 60.6% で、値 2 のProbability は 8.30% です。 つまり、問題ごとの平均時間が 44 ~ 70 分の範囲であった場合、60.6% のケースが最高のサービス グレード (値 1) のシフトにあり、ケースの 8.30% がサービス グレードが悪い (値 2) のシフトにあったことを意味します。
この情報からは、いくつかの結論を導き出すことができます。 問い合わせ応対時間が短いことは (44 ~ 70 の範囲)、サービス グレードの向上に強く影響しています (0.00 ~ 0.07 の範囲)。 スコア (92.35) からも、この変数が非常に重要であることがわかります。
ただし、要因リストの下の方に目を向けると、影響が微弱で解釈が難しいその他の要因がいくつか確認できます。 たとえば、シフトは一見、サービスに影響を及ぼすように見えますが、リフト スコアおよび相対的確率を見る限り、シフトはさほど大きな要因ではありません。
属性 | 値 | Favors < 0.07 | Favors >= 0.12 |
---|---|---|---|
案件あたりの平均時間 | 89.087 - 120.000 | スコア: 100 値の確率 1: 4.45 % 値の確率 2: 51.94 % 値 1 のリフト: 0.19 値 2 のリフト: 1.94 |
|
案件あたりの平均時間 | 44.000 - 70.597 | スコア : 92.35 値 1 の確率 : 60.06 % 値 2 の確率 : 8.30 % 値 1 のリフト : 2.61 値 2 のリフト : 0.31 |
Microsoft 汎用コンテンツ ツリー ビューアー
このビューアーを使用すると、モデルの処理時にアルゴリズムによって作成された、さらに詳しい情報を閲覧できます。 MicrosoftGeneric コンテンツ ツリー ビューアーは、マイニング モデルを一連のノードとして表します。各ノードは、トレーニング データに関する学習済みの知識を表します。 このビューアーは、あらゆるモデルで使用できますが、ノードの内容はモデルの種類によって異なります。
ニューラル ネットワーク モデルまたはロジスティック回帰モデルの場合、特に重要なのは marginal statistics node
です。 このノードには、データに含まれる値の分布に関して得られた統計が表示されます。 この情報は、多数の T-SQL クエリを作成せずにデータの概要を取得する必要がある場合に、役立てることができます。 前のトピックで、ビン分割値のグラフを取り上げましたが、このグラフは、マージナル統計ノードから導かれたものです。
マイニング モデルからデータ値の概要を取得するには
データ マイニング デザイナーの モデル ビューアー タブで、モデル名の <を選択します>。
Viewerリストから、[Microsoft 汎用コンテンツ ツリー ビューアー選択。
マイニング モデルのビューが更新されて、左側のペインにノード階層が、右側のペインに HTML テーブルが表示されます。
Node Caption ペインで、名前が 1000000000000000 のノードをクリックします。
どのモデルにも言えることですが、最上位のノードは常に、そのモデルのルート ノードです。 ニューラル ネットワーク モデルまたはロジスティック回帰モデルでは、その直下のノードがマージナル統計ノードです。
[ Node Details ペインで、行が見つかるまで下にスクロールNODE_DISTRIBUTION。
NODE_DISTRIBUTION テーブルを下にスクロールして、ニューラル ネットワークのアルゴリズムによって計算された値の分布を表示します。
このデータをレポートに使用するには、特定の行の情報を選択してコピーします。または、次のデータ マイニング拡張機能 (DMX) クエリを使用して、ノードの完全な内容を抽出することもできます。
SELECT *
FROM [Call Center EQ4].CONTENT
WHERE NODE_NAME = '10000000000000000'
ノード階層と、NODE_DISTRIBUTION テーブル内の詳細情報を使用して、ニューラル ネットワーク内のパスを個別にたどり、非表示になっているレイヤーの統計を閲覧することもできます。 詳細については、「 Neural ネットワーク モデルクエリの例」を参照してください。
このレッスンの次の作業
コール センター構造へのロジスティック回帰モデルの追加 (中間データ マイニング チュートリアル)
参照
ニューラル ネットワーク モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)
ニューラル ネットワーク モデルのクエリ例
Microsoft ニューラル ネットワーク アルゴリズム テクニカル リファレンス
マイニング モデルでの列の分離の変更