コール センター モデルの検証 (中級者向けデータ マイニング チュートリアル)
調査モデルを構築したら、それを使用して、データについてより深く考察することができます。具体的には、SQL Server データ ツール (SSDT) に備わっている次のツールを使用します。
Microsoft ニューラル ネットワーク ビューアー**:** このビューアーは、データ マイニング デザイナーの [マイニング モデル ビューアー] タブから利用でき、データに含まれるさまざまな相互関係を考察できるように設計されています。
Microsoft 汎用コンテンツ ツリー ビューアー**:** モデルの生成時にアルゴリズムによって検出されたパターンおよび統計に関する詳細を提供する標準的なビューアーです。
Microsoft ニューラル ネットワーク ビューアー
ビューアーには、[入力]、[出力]、および [変数] の 3 つのペインがあります。
[出力] ペインを使用することにより、予測可能な属性または従属変数に各種の値を選択できます。 モデルに複数の予測可能な属性が存在する場合は、[出力属性] リストから属性を選択できます。
[変数] ペインには、寄与している属性 (変数) という観点で選択した 2 つの結果の比較が表示されます。 色分けされたバーは、対象となる結果に対し、変数がどの程度強く影響を与えているかを視覚的に表します。 変数のリフト スコアを表示することもできます。 リフト スコアは、使用しているマイニング モデルの種類によって計算方法が異なりますが、一般には、予測にこの属性を使用した場合のモデルの改善状況を示します。
[入力] ペインでは、モデルにインフルエンサを追加することによって、さまざまな what-if (シナリオ) 分析を試行できます。
[出力] ペインの使用
この初期モデルでは、サービスのグレードに対して各種の要因がどのように影響を及ぼしているかを調べます。 そのためには、出力属性のリストから Service Grade を選択し、[値 1] および [値 2] のドロップダウン リストから範囲を選択することによって、異なるサービス レベルを比較します。
最低と最高のサービス グレードを比較するには
[値 1] で、最低の値を含む範囲を選択します。 たとえば、0 ~ 0.07 の範囲は、最低の電話放棄呼率 (つまり、最高のサービス水準) を表します。
注 この範囲に含まれる厳密な値は、モデルの構成方法によって異なる場合があります。
[値 2] で、最高の値を含む範囲を選択します。 たとえば、値が >=0.12 の範囲は、最高の電話放棄呼率 (つまり、最も悪いサービス グレード) を表します。 つまり、このシフト中に電話をかけてきた顧客の 12% が、担当者が応対する前に電話を切ったことになります。
[変数] ペインの内容が更新され、結果の値に寄与している属性が対比されます。 左側の列は、最高グレードのサービスに関連付けられている属性を表し、右側の列は、最低グレードのサービスに関連付けられている属性を表します。
[変数] ペインの使用
このモデルでは、[案件あたりの平均時間] が重要な要因です。 この変数は、問い合わせの種類に関係なく、問い合わせから回答までに要した平均時間を示します。
属性の確率スコアとリフト スコアを表示およびコピーするには
[変数] ペインで、先頭行の色分けされたバーの上にマウスを合わせます。
この色分けされたバーは、[AverageTimePerIssue] がサービスのグレードに対し、どの程度寄与しているかを示すものです。 ツールヒントには、変数と対象となる結果の組み合わせごとに、全体的なスコア、確率、およびリフト スコアが表示されます。
[変数] ペインで、色分けされたバーを右クリックし、[コピー] を選択します。
Excel ワークシートで、任意のセルを右クリックし、[貼り付け] を選択します。
レポートが HTML テーブルとして貼り付けられ、各バーのスコアだけが表示されます。
別の Excel ワークシートで、任意のセルを右クリックし、[形式を選択して貼り付け] を選択します。
レポートがテキスト形式で貼り付けられ、関連する統計 (次のセクションで説明) が表示されます。
[入力] ペインの使用
シフトやオペレーターの人数など、特定の要因の影響を調べているとします。 [入力] ペインを使用して特定の変数を選択すると、[変数] ペインが自動的に更新され、指定された変数に基づいて、直前に選択された 2 つのグループの比較結果が表示されます。
入力属性を変更することによってサービス グレードへの影響をレビューするには
[入力] ペインで、[属性] に Shift を選択します。
[値] で、[AM] を選択します。
[変数] ペインが更新されて、シフトを AM にした場合のモデルへの影響が表示されます。 それ以外のすべての選択内容は変わりません。引き続き、最低と最高のサービス グレードが対比されます。
[値] で [PM1] を選択します。
[変数] ペインが更新されて、シフトを変更した場合のモデルへの影響が表示されます。
[入力] ペインで、[属性] から次の空白行をクリックし、Calls を選択します。 [値] で、問い合わせの最大件数を示す範囲を選択します。
リストに新しい入力条件が追加されます。 [変数] ペインが更新され、特定のシフトについて、問い合わせ件数が最大の場合のモデルへの影響が表示されます。
Shift および Calls の値を変更しながら、シフト、問い合わせ件数、およびサービス グレードの間に、何か相関関係がないか見極めます。
注 [入力] ペインをクリアして他の属性を使用できるようにするには、[ビューアーのコンテンツを最新状態に更新] をクリックします。
ビューアーに表示される統計の解釈
待ち時間が長ければ、電話放棄呼率が高くなり、サービス グレードも低下します。 当然の結果のようにも見えますが、マイニング モデルは、その傾向を読み解くための補足的な統計データをいくつか提供します。
スコア : ある結果と別の結果との差異を見分けるときに、この変数の全体的な重要度を示す値。 スコアが高いほど、その変数が結果に及ぼす影響は強くなります。
値 1 の確率 : 結果に対する値の確率を表すパーセンテージ。
値 2 の確率 : 結果に対する値の確率を表すパーセンテージ。
値 1 のリフト/値 2 のリフト : 値 1 と値 2 の結果を予測する際に、この特定の変数を使用することの影響を表すスコア。 スコアが高いほど、その変数を使って、効果的に結果を予測することができます。
次の表に、トップ インフルエンサについて、いくつかの値の例を示します。 たとえば、値 1 の確率は 60.6% で、値 2 の確率は 8.30% です。つまり、Average Time Per Issue が 44 ~ 70 分の範囲にある場合、サポート案件の 60.6% は、最高のサービス グレード (値 1) のシフトに存在し、サポート案件の 8.30% は最低のサービス グレード (値 2) のシフトに存在することになります。
この情報からは、いくつかの結論を導き出すことができます。 問い合わせ応対時間が短いことは (44 ~ 70 の範囲)、サービス グレードの向上に強く影響しています (0.00 ~ 0.07 の範囲)。 スコア (92.35) からも、この変数が非常に重要であることがわかります。
ただし、要因リストの下の方に目を向けると、影響が微弱で解釈が難しいその他の要因がいくつか確認できます。 たとえば、シフトは一見、サービスに影響を及ぼすように見えますが、リフト スコアおよび相対的確率を見る限り、シフトはさほど大きな要因ではありません。
属性 |
値 |
水準 < 0.07 |
水準 >= 0.12 |
|||||
---|---|---|---|---|---|---|---|---|
Average Time Per Issue |
89.087 - 120.000 |
|
|
|||||
案件あたりの平均時間 |
44.000 - 70.597 |
|
|
トップに戻る
Microsoft 汎用コンテンツ ツリー ビューアー
このビューアーを使用すると、モデルの処理時にアルゴリズムによって作成された、さらに詳しい情報を閲覧できます。 Microsoft 汎用コンテンツ ツリー ビューアーはマイニング モデルを一連のノードで表します。各ノードは、トレーニング データに関する学習済みの知識を表します。 このビューアーは、あらゆるモデルで使用できますが、ノードの内容はモデルの種類によって異なります。
ニューラル ネットワーク モデルまたはロジスティック回帰モデルの場合、特に重要なのは marginal statistics node です。 このノードには、データに含まれる値の分布に関して得られた統計が表示されます。 この情報は、多数の T-SQL クエリを作成せずにデータの概要を取得する必要がある場合に、役立てることができます。 前のトピックで、ビン分割値のグラフを取り上げましたが、このグラフは、マージナル統計ノードから導かれたものです。
マイニング モデルからデータ値の概要を取得するには
データ マイニング デザイナーの [マイニング モデル ビューアー] タブで、<マイニング モデル名> を選択します。
[ビューアー] ボックスの一覧で [Microsoft 汎用コンテンツ ツリー ビューアー] をクリックします。
マイニング モデルのビューが更新されて、左側のペインにノード階層が、右側のペインに HTML テーブルが表示されます。
[ノードのキャプション] ペインで、10000000000000000 という名前のノードをクリックします。
どのモデルにも言えることですが、最上位のノードは常に、そのモデルのルート ノードです。 ニューラル ネットワーク モデルまたはロジスティック回帰モデルでは、その直下のノードがマージナル統計ノードです。
[ノードの詳細] ペインを下にスクロールしながら、NODE_DISTRIBUTION という行を探します。
NODE_DISTRIBUTION テーブルを下にスクロールして、ニューラル ネットワークのアルゴリズムによって計算された値の分布を表示します。
このデータをレポートに使用するには、特定の行の情報を選択してコピーします。または、次のデータ マイニング拡張機能 (DMX) クエリを使用して、ノードの完全な内容を抽出することもできます。
SELECT *
FROM [Call Center EQ4].CONTENT
WHERE NODE_NAME = '10000000000000000'
ノード階層と、NODE_DISTRIBUTION テーブル内の詳細情報を使用して、ニューラル ネットワーク内のパスを個別にたどり、非表示になっているレイヤーの統計を閲覧することもできます。 詳細については、「ニューラル ネットワーク モデルのクエリ例」を参照してください。
トップに戻る
このレッスンの次の作業
コール センター構造へのロジスティック回帰モデルの追加 (中級者向けデータ マイニング チュートリアル)
関連項目
タスク
参照
ニューラル ネットワーク モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)
Microsoft ニューラル ネットワーク アルゴリズム テクニカル リファレンス