コール センター データ用のデータ ソース ビューの追加 (中級者向けデータ マイニング チュートリアル)
ここでは、コール センター データへのアクセスに使用するデータ ソース ビューを追加します。 最初に調査用のニューラル ネットワーク モデルを構築し、その後、提案作成用のロジスティック回帰モデルを構築します。どちらのモデルにも、同じデータを使用します。
さらに、データ ソース ビュー デザイナーを使用して曜日の列を追加します。 これは、ソース データによってコール センター データを日付別に追跡していますが、問い合わせ件数とサービス品質にはどちらも、週末か平日かによって定期的なパターンがあることが経験上わかっているためです。
手順
データ ソース ビューを追加するには
ソリューション エクスプローラーで [データ ソース ビュー]を右クリックし、 [新しいデータ ソース ビュー]をクリックします。
データ ソース ビュー ウィザードが開きます。
[データ ソース ビュー ウィザードへようこそ] ページで [次へ] をクリックします。
[ データ ソースの選択 ] ページの [ リレーショナル データ ソース] で、Adventure Works DW 多次元 2012 データ ソースを選択します。 このデータ ソースがない場合は、「 基本的なデータ マイニング チュートリアル」を参照してください。 [次へ] をクリックします。
[ テーブルとビューの選択 ] ページで、次の表を選択し、右矢印をクリックしてデータ ソース ビューに追加します。
FactCallCenter (dbo)
DimDate
[次へ] をクリックします。
[ ウィザードの完了 ] ページの既定では、データ ソース ビューの名前は Adventure Works DW 多次元 2012 です。 名前を CallCenter に変更し、[完了] をクリック します。
[データ ソース ビュー] Designerが開き、CallCenter データ ソース ビューが表示されます。
[データ ソース ビュー] ペイン内を右クリックし、[ テーブルの追加と削除] を選択します。 テーブル DimDate を選択し、[OK] をクリック します。
各テーブルの列間にリレーションシップを
DateKey
自動的に追加する必要があります。 このリレーションシップを使用して、DimDate テーブルから EnglishDayNameOfWeek 列を取得し、モデルで使用します。データ ソース ビュー デザイナーで、テーブル FactCallCenter を右クリックし、[ 新しい名前付き計算] を選択します。
[ 名前付き計算の作成 ] ダイアログ ボックスで、次の値を入力します。
列名 DayOfWeek 説明 DimDate テーブルから曜日を取得。 [式] (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)
式によって必要なデータが作成されることを確認するには、テーブル FactCallCenter を右クリックし、[ データの探索] を選択します。
データ マイニングでの使用方法を理解するために、使用可能なデータを少し時間をかけて確認します。
列名 | Contains |
---|---|
FactCallCenterID | データ ウェアハウスにデータがインポートされたときに作成される任意のキー。 この列は一意のレコードを識別する列で、データ マイニング モデルのケース キーとして使用されます。 |
DateKey | コール センター業務の日付 (整数値)。 データ ウェアハウスでは日付のキーに整数がよく使用されますが、日付の値でグループ化する場合は、日付/時刻の形式で日付を取得することもできます。 ベンダーからは日々、シフトごとに別個のレポートが提供されるため、日付は一意ではありません。 |
WageType | その日が平日、週末、または休日だったかどうかを示します。 週末と平日の顧客サービスの品質に違いがある可能性があるため、この列を入力として使用します。 |
Shift キー | 問い合わせが記録されるシフトを示します。 このコール センターでは、1 日の労働時間が、AM、PM1、PM2、Midnight の 4 つのシフトに分かれています。 カスタマー サービスの質がシフトによって異なる可能性があるため、この列を入力として使用します。 |
LevelOneOperators | レベル 1 のオペレーターの勤務時間の数を示します。 コール センターの従業員のレベルはレベル 1 から始まるため、このレベルの従業員は経験が浅い従業員です。 |
LevelTwoOperators | 勤務しているレベル 2 オペレーターの人数を示します。 従業員は、レベル 2 オペレーターとして資格を得るために、特定のサービス時間数をログに記録する必要があります。 |
TotalOperators | シフト中に勤務しているオペレーターの人数の合計。 |
呼び出し | シフト中に受けた問い合わせの件数。 |
AutomaticResponses | 完全に自動呼処理 (対話型音声応答、IVR) によって処理された問い合わせの件数。 |
Orders | 問い合わせの結果として発生した注文の件数。 |
IssuesRaised | 問い合わせによって発生した、フォローアップが必要な案件の件数。 |
AverageTimePerIssue | 問い合わせの電話への応対に要した平均時間。 |
ServiceGrade | 一般的なサービス品質を示すメトリック。シフト全体の 破棄率 として測定されます。 電話放棄呼率が高いほど、顧客の満足度が低下し、注文の機会を失う可能性が高くなります。 |
データには、1 つの日付列に基づく 4 つの異なる列 WageType
( 、DayOfWeek、、 Shift
および DateKey
) が含まれていることに注意してください。 通常、データ マイニングでは、同じデータから派生する列を複数使用することはお勧めしません。それらの値の間の関連が強すぎて、他のパターンがわかりにくくなることがあるからです。
ただし、一意の値が多すぎるため、モデルでは 使用 DateKey
しません。 DayOfWeek と DayOfWeek の間Shift
には直接的な関係はなく、WageType
DayOfWeek は部分的にしか関連しません。 共線性について気にかかる場合は、使用可能なすべての列を使用して構造を作成し、モデルごとに無視する列を変えて影響をテストしてみてください。
このレッスンの次の作業
ニューラル ネットワーク構造およびモデルの作成 (中級者向けデータ マイニング チュートリアル)