Поделиться через


Добавление представления источников данных для данных Call Center (учебник по интеллектуальному анализу данных — средний уровень)

 

Применимо к: SQL Server 2016 Preview

В этой задаче добавляется представление источника данных, которое будет использоваться для доступа к данным центра обработки вызовов. Для построения исходной модели нейронной сети, предназначенной для исследования, и модели логистической регрессии, с помощью которой будут даваться рекомендации, будут использоваться одни и те же данные.

Также для добавления столбца дня недели будет использован конструктор представлений исходных данных. Это необходимо, поскольку исходный код отслеживает данные по датам центра обработки вызовов, при этом опыт подсказывает, что существуют повторяющиеся шаблоны как в плане объема, так и в плане качества обслуживания, в зависимости от того, является ли этот день выходным или рабочим днем.

Процедуры

Добавление представления источников данных

  1. В обозревателе, щелкните правой кнопкой мыши представления источников данных, и выберите новое представление источника данных.

    Будет открыт мастер представлений источников данных.

  2. На странице Мастер представления источника данных нажмите кнопку Далее.

  3. На выбрать источник данных в разделе Реляционные источники данных, выберите Adventure Works DW Multidimensional 2012 источника данных. Если у вас этот источник данных, см. раздел основам интеллектуального анализа данных. Нажмите кнопку Далее.

  4. На Выбор таблиц и представлений выберите следующие таблицы и затем щелкните стрелку вправо, чтобы добавить его в представлении источника данных:

    • FactCallCenter (dbo)

    • DimDate

  5. Нажмите кнопку Далее.

  6. На Завершение работы мастера страницы по умолчанию имя представления источника данных Adventure Works DW Multidimensional 2012. Измените имя на CallCenter, а затем нажмите кнопку Готово.

    Откроется конструктор представлений источников данных для отображения CallCenter представление источника данных.

  7. Щелкните правой кнопкой мыши в области представления источника данных и выберите Добавление или удаление таблиц. Выберите таблицу, DimDate и нажмите кнопку ОК.

    Связь будет добавлена автоматически между DateKey столбцов в каждой таблице. Эта связь будет использовать для получения столбце EnglishDayNameOfWeek, из DimDate и использовать его в модели.

  8. В конструкторе представлений источников данных щелкните правой кнопкой мыши таблицу, FactCallCenter, и выберите Создать именованное вычисление.

    В Создание именованного вычисления диалоговом окне введите следующие значения:

    Имя столбца DayOfWeek
    Description Получение дня недели из таблицы DimDate
    Выражение (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    Чтобы убедиться, что выражение создает данные щелкните правой кнопкой таблицу FactCallCenter, а затем выберите Просмотр данных.

  9. Внимательно просмотрите доступные данные и постарайтесь понять, как они используются в интеллектуальном анализе данных.

Имя столбца Содержит
FactCallCenterID При импорте данных в хранилище данных создается произвольный ключ.

Этот столбец идентифицирует уникальные записи. Его следует использовать в качестве ключа вариантов для модели интеллектуального анализа данных.
DateKey Дата работы центра обработки вызовов в виде целого числа. Целочисленные ключи дат часто используются в хранилищах данных, однако может потребоваться получить дату в формате дата/время для группирования по значениям даты.

Обратите внимание, что даты не являются уникальными, поскольку поставщик предоставляет отдельный отчет для каждой смены в каждый день работы.
WageType Показывает, является день рабочим, выходным или праздничным.

Вполне возможно, что есть разница в качество обслуживания клиентов в выходные дни и дни недели, этот столбец будет использовать в качестве входных данных.
Shift Указывает смену, для которой регистрируется звонок. Этот центр обработки вызовов разделяет рабочий день на четыре смены: AM, PM1, PM2 и Midnight.

Смена может влиять на качество обслуживания клиентов, поэтому она будет входными данными.
LevelOneOperators Указывает число операторов уровня 1 пошлины.

Сотрудники центра обработки вызовов начинают на уровне 1, поэтому они менее опытные.
LevelTwoOperators Указывает число операторов уровня 2 на дежурстве.

Чтобы стать оператором уровня 2, сотрудник должен отработать определенное количество часов и зарегистрировать их в журнале.
TotalOperators Общее количество операторов, присутствующих на смене.
Вызовы Число звонков, полученных в течении смены.
AutomaticResponses Число звонков, полностью обработанных системой автоматической обработки (голосовое меню или IVR).
Orders Число заказов, принятых в результате телефонных звонков.
IssuesRaised Число проблем, требующих дополнительного рассмотрения, о которых было сообщено по телефону.
AverageTimePerIssue Среднее время, необходимое для ответа на входящий звонок.
ServiceGrade Показатель, отражающий общее качество обслуживания, измеряемый прекращенных за всю смену. Чем выше показатель звонков, прекращенных абонентом во время ожидания, тем более вероятно, что клиенты остаются недовольными, а компания теряет потенциальные заказы.

Обратите внимание, что данные включают четыре различных столбцов, основанных на одном столбце дат: WageType, DayOfWeek, Shift, и DateKey. Обычно в интеллектуальном анализе данных лучше использовать несколько столбцов, полученных из одних данных, поскольку значения очень сильно коррелируют друг с другом и могут скрывать другие шаблоны.

Тем не менее, мы не будем использовать DateKey в модели, так как она содержит слишком много уникальных значений. Не существует прямой связи между Shift и DayOfWeek, и WageType и DayOfWeek связаны только частично. Если есть озабоченность по поводу коллинеарности, можно создать структуру, используя все доступные столбцы, затем проигнорировать другие столбцы в каждой модели и протестировать результаты.

Следующая задача занятия

Создание структуры нейронной сети и модели ( учебник по интеллектуальному анализу данных — средний )

См. также:

Представления источников данных в многомерных моделях