次の方法で共有


コール センター データ用のデータ ソース ビューの追加 (中級者向けデータ マイニング チュートリアル)

ここでは、コール センター データへのアクセスに使用するデータ ソース ビューを追加します。 最初に調査用のニューラル ネットワーク モデルを構築し、その後、提案作成用のロジスティック回帰モデルを構築します。どちらのモデルにも、同じデータを使用します。

さらに、データ ソース ビュー デザイナーを使用して曜日の列を追加します。 これは、ソース データによってコール センター データを日付別に追跡していますが、問い合わせ件数とサービス品質にはどちらも、週末か平日かによって定期的なパターンがあることが経験上わかっているためです。

手順

データ ソース ビューを追加するには

  1. ソリューション エクスプローラー[データ ソース ビュー]を右クリックし、 [新しいデータ ソース ビュー]をクリックします。

    データ ソース ビュー ウィザードが開きます。

  2. [データ ソース ビュー ウィザードへようこそ] ページで [次へ] をクリックします。

  3. [ データ ソースの選択 ] ページの [ リレーショナル データ ソース] で、Adventure Works DW 多次元 2012 データ ソースを選択します。 このデータ ソースがない場合は、「 基本的なデータ マイニング チュートリアル」を参照してください。 [次へ] をクリックします。

  4. [ テーブルとビューの選択 ] ページで、次の表を選択し、右矢印をクリックしてデータ ソース ビューに追加します。

    • FactCallCenter (dbo)

    • DimDate

  5. [次へ] をクリックします。

  6. [ ウィザードの完了 ] ページの既定では、データ ソース ビューの名前は Adventure Works DW 多次元 2012 です。 名前を CallCenter に変更し、[完了] をクリック します

    [データ ソース ビュー] Designerが開き、CallCenter データ ソース ビューが表示されます。

  7. [データ ソース ビュー] ペイン内を右クリックし、[ テーブルの追加と削除] を選択します。 テーブル DimDate を選択し、[OK] をクリック します

    各テーブルの列間にリレーションシップを DateKey 自動的に追加する必要があります。 このリレーションシップを使用して、DimDate テーブルから EnglishDayNameOfWeek 列を取得し、モデルで使用します。

  8. データ ソース ビュー デザイナーで、テーブル FactCallCenter を右クリックし、[ 新しい名前付き計算] を選択します。

    [ 名前付き計算の作成 ] ダイアログ ボックスで、次の値を入力します。

    列名 DayOfWeek
    説明 DimDate テーブルから曜日を取得。
    [式] (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    式によって必要なデータが作成されることを確認するには、テーブル FactCallCenter を右クリックし、[ データの探索] を選択します。

  9. データ マイニングでの使用方法を理解するために、使用可能なデータを少し時間をかけて確認します。

列名 Contains
FactCallCenterID データ ウェアハウスにデータがインポートされたときに作成される任意のキー。

この列は一意のレコードを識別する列で、データ マイニング モデルのケース キーとして使用されます。
DateKey コール センター業務の日付 (整数値)。 データ ウェアハウスでは日付のキーに整数がよく使用されますが、日付の値でグループ化する場合は、日付/時刻の形式で日付を取得することもできます。

ベンダーからは日々、シフトごとに別個のレポートが提供されるため、日付は一意ではありません。
WageType その日が平日、週末、または休日だったかどうかを示します。

週末と平日の顧客サービスの品質に違いがある可能性があるため、この列を入力として使用します。
Shift キー 問い合わせが記録されるシフトを示します。 このコール センターでは、1 日の労働時間が、AM、PM1、PM2、Midnight の 4 つのシフトに分かれています。

カスタマー サービスの質がシフトによって異なる可能性があるため、この列を入力として使用します。
LevelOneOperators レベル 1 のオペレーターの勤務時間の数を示します。

コール センターの従業員のレベルはレベル 1 から始まるため、このレベルの従業員は経験が浅い従業員です。
LevelTwoOperators 勤務しているレベル 2 オペレーターの人数を示します。

従業員は、レベル 2 オペレーターとして資格を得るために、特定のサービス時間数をログに記録する必要があります。
TotalOperators シフト中に勤務しているオペレーターの人数の合計。
呼び出し シフト中に受けた問い合わせの件数。
AutomaticResponses 完全に自動呼処理 (対話型音声応答、IVR) によって処理された問い合わせの件数。
Orders 問い合わせの結果として発生した注文の件数。
IssuesRaised 問い合わせによって発生した、フォローアップが必要な案件の件数。
AverageTimePerIssue 問い合わせの電話への応対に要した平均時間。
ServiceGrade 一般的なサービス品質を示すメトリック。シフト全体の 破棄率 として測定されます。 電話放棄呼率が高いほど、顧客の満足度が低下し、注文の機会を失う可能性が高くなります。

データには、1 つの日付列に基づく 4 つの異なる列 WageType( 、DayOfWeek、、 Shiftおよび DateKey) が含まれていることに注意してください。 通常、データ マイニングでは、同じデータから派生する列を複数使用することはお勧めしません。それらの値の間の関連が強すぎて、他のパターンがわかりにくくなることがあるからです。

ただし、一意の値が多すぎるため、モデルでは 使用 DateKey しません。 DayOfWeek と DayOfWeek の間Shiftには直接的な関係はなく、WageTypeDayOfWeek は部分的にしか関連しません。 共線性について気にかかる場合は、使用可能なすべての列を使用して構造を作成し、モデルごとに無視する列を変えて影響をテストしてみてください。

このレッスンの次の作業

ニューラル ネットワーク構造およびモデルの作成 (中級者向けデータ マイニング チュートリアル)

参照

多次元モデル内のデータ ソース ビュー