Добавление представления источников данных для данных Call Center (учебник по интеллектуальному анализу данных — средний уровень)
Применимо к: SQL Server 2016 Preview
В этой задаче добавляется представление источника данных, которое будет использоваться для доступа к данным центра обработки вызовов. Для построения исходной модели нейронной сети, предназначенной для исследования, и модели логистической регрессии, с помощью которой будут даваться рекомендации, будут использоваться одни и те же данные.
Также для добавления столбца дня недели будет использован конструктор представлений исходных данных. Это необходимо, поскольку исходный код отслеживает данные по датам центра обработки вызовов, при этом опыт подсказывает, что существуют повторяющиеся шаблоны как в плане объема, так и в плане качества обслуживания, в зависимости от того, является ли этот день выходным или рабочим днем.
Процедуры
Добавление представления источников данных
В обозревателе, щелкните правой кнопкой мыши представления источников данных, и выберите новое представление источника данных.
Будет открыт мастер представлений источников данных.
На странице Мастер представления источника данных нажмите кнопку Далее.
На выбрать источник данных в разделе Реляционные источники данных, выберите Adventure Works DW Multidimensional 2012 источника данных. Если у вас этот источник данных, см. раздел основам интеллектуального анализа данных. Нажмите кнопку Далее.
На Выбор таблиц и представлений выберите следующие таблицы и затем щелкните стрелку вправо, чтобы добавить его в представлении источника данных:
FactCallCenter (dbo)
DimDate
Нажмите кнопку Далее.
На Завершение работы мастера страницы по умолчанию имя представления источника данных Adventure Works DW Multidimensional 2012. Измените имя на CallCenter, а затем нажмите кнопку Готово.
Откроется конструктор представлений источников данных для отображения CallCenter представление источника данных.
Щелкните правой кнопкой мыши в области представления источника данных и выберите Добавление или удаление таблиц. Выберите таблицу, DimDate и нажмите кнопку ОК.
Связь будет добавлена автоматически между DateKey столбцов в каждой таблице. Эта связь будет использовать для получения столбце EnglishDayNameOfWeek, из DimDate и использовать его в модели.
В конструкторе представлений источников данных щелкните правой кнопкой мыши таблицу, FactCallCenter, и выберите Создать именованное вычисление.
В Создание именованного вычисления диалоговом окне введите следующие значения:
Имя столбца DayOfWeek Description Получение дня недели из таблицы DimDate Выражение (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)
Чтобы убедиться, что выражение создает данные щелкните правой кнопкой таблицу FactCallCenter, а затем выберите Просмотр данных.
Внимательно просмотрите доступные данные и постарайтесь понять, как они используются в интеллектуальном анализе данных.
Имя столбца | Содержит |
---|---|
FactCallCenterID | При импорте данных в хранилище данных создается произвольный ключ. Этот столбец идентифицирует уникальные записи. Его следует использовать в качестве ключа вариантов для модели интеллектуального анализа данных. |
DateKey | Дата работы центра обработки вызовов в виде целого числа. Целочисленные ключи дат часто используются в хранилищах данных, однако может потребоваться получить дату в формате дата/время для группирования по значениям даты. Обратите внимание, что даты не являются уникальными, поскольку поставщик предоставляет отдельный отчет для каждой смены в каждый день работы. |
WageType | Показывает, является день рабочим, выходным или праздничным. Вполне возможно, что есть разница в качество обслуживания клиентов в выходные дни и дни недели, этот столбец будет использовать в качестве входных данных. |
Shift | Указывает смену, для которой регистрируется звонок. Этот центр обработки вызовов разделяет рабочий день на четыре смены: AM, PM1, PM2 и Midnight. Смена может влиять на качество обслуживания клиентов, поэтому она будет входными данными. |
LevelOneOperators | Указывает число операторов уровня 1 пошлины. Сотрудники центра обработки вызовов начинают на уровне 1, поэтому они менее опытные. |
LevelTwoOperators | Указывает число операторов уровня 2 на дежурстве. Чтобы стать оператором уровня 2, сотрудник должен отработать определенное количество часов и зарегистрировать их в журнале. |
TotalOperators | Общее количество операторов, присутствующих на смене. |
Вызовы | Число звонков, полученных в течении смены. |
AutomaticResponses | Число звонков, полностью обработанных системой автоматической обработки (голосовое меню или IVR). |
Orders | Число заказов, принятых в результате телефонных звонков. |
IssuesRaised | Число проблем, требующих дополнительного рассмотрения, о которых было сообщено по телефону. |
AverageTimePerIssue | Среднее время, необходимое для ответа на входящий звонок. |
ServiceGrade | Показатель, отражающий общее качество обслуживания, измеряемый прекращенных за всю смену. Чем выше показатель звонков, прекращенных абонентом во время ожидания, тем более вероятно, что клиенты остаются недовольными, а компания теряет потенциальные заказы. |
Обратите внимание, что данные включают четыре различных столбцов, основанных на одном столбце дат: WageType, DayOfWeek, Shift, и DateKey. Обычно в интеллектуальном анализе данных лучше использовать несколько столбцов, полученных из одних данных, поскольку значения очень сильно коррелируют друг с другом и могут скрывать другие шаблоны.
Тем не менее, мы не будем использовать DateKey в модели, так как она содержит слишком много уникальных значений. Не существует прямой связи между Shift и DayOfWeek, и WageType и DayOfWeek связаны только частично. Если есть озабоченность по поводу коллинеарности, можно создать структуру, используя все доступные столбцы, затем проигнорировать другие столбцы в каждой модели и протестировать результаты.
Следующая задача занятия
Создание структуры нейронной сети и модели ( учебник по интеллектуальному анализу данных — средний )