次の方法で共有


コール センター データ用のデータ ソース ビューの追加 (中級者向けデータ マイニング チュートリアル)

ここでは、コール センター データへのアクセスに使用するデータ ソース ビューを追加します。 最初に調査用のニューラル ネットワーク モデルを構築し、その後、提案作成用のロジスティック回帰モデルを構築します。どちらのモデルにも、同じデータを使用します。

さらに、データ ソース ビュー デザイナーを使用して曜日の列を追加します。 これは、ソース データによってコール センター データを日付別に追跡していますが、問い合わせ件数とサービス品質にはどちらも、週末か平日かによって定期的なパターンがあることが経験上わかっているためです。

手順

データ ソース ビューを追加するには

  1. ソリューション エクスプローラー[データ ソース ビュー] を右クリックし、[新しいデータ ソース ビュー] をクリックします。

    データ ソース ビュー ウィザードが開きます。

  2. [データ ソース ビュー ウィザードへようこそ] ページで [次へ] をクリックします。

  3. [データ ソースの選択] ページの [リレーショナル データ ソース] で、 Adventure Works DW Multidimensional 2012 データ ソースを選択します。 このデータ ソースがない場合は、「基本的なデータ マイニング チュートリアル」を参照してください。 [次へ] をクリックします。

  4. [テーブルとビューの選択] ページで次のテーブルを選択し、右矢印をクリックしてデータ ソース ビューに追加します。

    • FactCallCenter (dbo)

    • DimDate

  5. [次へ] をクリックします。

  6. 既定では、 Adventure Works DW Multidimensional 2012 という名前のデータ ソース ビューが [ウィザードの完了] ページに表示されます。 この名前を CallCenter に変更し、[完了] をクリックします。

    データ ソース ビュー デザイナーが開き、CallCenter データ ソース ビューが表示されます。

  7. [データ ソース ビュー] ペイン内で右クリックし、[テーブルの追加と削除] をクリックします。 DimDate テーブルを選択し、[OK] をクリックします。

    各テーブルの DateKey 列間のリレーションシップが自動的に追加されます。 このリレーションシップは、EnglishDayNameOfWeek 列を DimDate テーブルから取得してモデルで使用するときに使用します。

  8. データ ソース ビュー デザイナーで、FactCallCenter テーブルを右クリックし、[新しい名前付き計算] をクリックします。

    [名前付き計算の作成] ダイアログ ボックスで、次の値を入力します。

    列名

    DayOfWeek

    説明

    DimDate テーブルから曜日を取得。

    (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    必要なデータがこの式で作成されることを確認するには、FactCallCenter テーブルを右クリックし、[データの探索] をクリックします。

  9. データ マイニングでの使用方法を理解するために、使用可能なデータを少し時間をかけて確認します。

列名

内容

FactCallCenterID

データ ウェアハウスにデータがインポートされたときに作成される任意のキー。

この列は一意のレコードを識別する列で、データ マイニング モデルのケース キーとして使用されます。

DateKey

コール センター業務の日付 (整数値)。 データ ウェアハウスでは日付のキーに整数がよく使用されますが、日付の値でグループ化する場合は、日付/時刻の形式で日付を取得することもできます。

ベンダーからは日々、シフトごとに別個のレポートが提供されるため、日付は一意ではありません。

WageType

平日、週末、祝日のいずれに該当するかを示します。

カスタマー サービスの質に週末と平日で差がある可能性があるため、 この列を入力として使用します。

Shift

問い合わせが記録されるシフトを示します。 このコール センターでは、1 日の労働時間が、AM、PM1、PM2、Midnight の 4 つのシフトに分かれています。

カスタマー サービスの質がシフトによって異なる可能性があるため、この列を入力として使用します。

LevelOneOperators

勤務しているレベル 1 オペレーターの人数を示します。

コール センターの従業員のレベルはレベル 1 から始まるため、このレベルの従業員は経験が浅い従業員です。

LevelTwoOperators

勤務しているレベル 2 オペレーターの人数を示します。

従業員は一定の実働時間を満たして初めて、レベル 2 のオペレーターになることができます。

TotalOperators

シフト中に勤務しているオペレーターの人数の合計。

Calls

シフト中に受けた問い合わせの件数。

AutomaticResponses

完全に自動呼処理 (対話型音声応答、IVR) によって処理された問い合わせの件数。

Orders

問い合わせの結果として発生した注文の件数。

IssuesRaised

問い合わせによって発生した、フォローアップが必要な案件の件数。

AverageTimePerIssue

問い合わせの電話への応対に要した平均時間。

ServiceGrade

サービスの全体的な質を示す 1 つの指標である、シフトごとの電話放棄呼率。 電話放棄呼率が高いほど、顧客の満足度が低下し、注文の機会を失う可能性が高くなります。

このデータには、1 つの日付列に基づく列が 4 つ含まれていることに注意してください。WageTypeDayOfWeekShift、および DateKey の 4 つです。 通常、データ マイニングでは、同じデータから派生する列を複数使用することはお勧めしません。それらの値の間の関連が強すぎて、他のパターンがわかりにくくなることがあるからです。

ただし、このモデルでは、一意の値が多すぎるため、DateKey を使用していません。 また、ShiftDayOfWeek には直接的なリレーションシップがなく、WageTypeDayOfWeek のリレーションシップも一部だけです。 共線性について気にかかる場合は、使用可能なすべての列を使用して構造を作成し、モデルごとに無視する列を変えて影響をテストしてみてください。

このレッスンの次の作業

ニューラル ネットワーク構造およびモデルの作成 (中級者向けデータ マイニング チュートリアル)

関連項目

概念

多次元モデルのデータ ソース ビュー