Создание прогнозов для моделей Call Center (учебник по интеллектуальному анализу данных — средний уровень)

Статья
11/01/2016

Применимо к: SQL Server 2016 Preview

Когда выявлены некоторые взаимосвязи между сменами, числом операторов, звонками и качеством обслуживания, можно создавать прогнозирующие запросы, которые будут использоваться в бизнес-аналитике и планировании. Вначале будут созданы прогнозы на исследовательской модели, чтобы проверить некоторые предположения. Затем с помощью модели логистической регрессии будут созданы массовые прогнозы.

На этом занятии предполагается, что пользователю уже известно, что такое прогнозирующий запрос.

Создание прогнозов с помощью модели нейронной сети

В следующем примере показано, как создать одноэлементный прогноз с помощью модели нейронной сети, созданной для исследования. Одноэлементные прогнозы служат хорошим способом проверить различные значения, чтобы оценить их воздействие на модель. В этом сценарии будет прогнозироваться уровень обслуживания для полуночной смены (без указания дня недели), если на дежурстве находятся шесть опытных операторов.

Создание одноэлементного запроса с помощью модели нейронной сети

В среде SQL Server Data Tools (SSDT) откройте решение с моделью, которую вы хотите использовать.
В конструкторе интеллектуального анализа данных щелкните Прогнозирование моделей интеллектуального анализа вкладки.
В модель интеллектуального анализа данных панели, щелкните Выбор модели.
Выбор модели интеллектуального анализа данных диалоговом окне отображается список структур интеллектуального анализа данных. Разверните структуру интеллектуального анализа данных, чтобы просмотреть список моделей интеллектуального анализа данных, связанных с этой структурой.
Разверните структуру интеллектуального анализа данных Call Center Default и выберите модель нейронной сети — Call Center-LR.
В меню Модель интеллектуального анализа данных выберите пункт Одноэлементный запрос.

Одноэлементного запроса появится диалоговое окно с столбцы сопоставляются со столбцами в модели интеллектуального анализа данных.
В одноэлементного запроса диалоговом щелкните строку для Shift и выберите полночь.
Щелкните строку для атрибута Lvl 2 Operators и введите 6.
В нижней половине Прогнозирование моделей интеллектуального анализа вкладку, щелкните первую строку в сетке.
В источника столбец, щелкните стрелку вниз и выберите Прогнозирующая функция. В поле выберите PredictHistogram.

Список аргументов, которые можно использовать с помощью этой функции прогнозирования, автоматически отображается в Критерий или аргумент поле.
Перетащите столбец ServiceGrade из списка столбцов в модель интеллектуального анализа данных панели Критерий или аргумент поле.

Имя столбца автоматически вставляется в качестве аргумента. В это текстовое поле можно перетащить любой прогнозируемый атрибут.
Нажмите кнопку коммутатора для запроса представления результатов, в верхнем углу построителя прогнозирующих запросов.

Ожидаемые результаты содержат возможные прогнозируемые значения для каждого уровня обслуживания при заданных входных данных, а также значения несущего множества и вероятности для каждого прогноза. В любой момент можно вернуться в режим конструктора, чтобы изменить входные данные или добавить дополнительные входные данные.

Создание прогнозов с помощью модели логистической регрессии

Если уже известны атрибуты, относящиеся к бизнес-задаче, можно использовать модель логистической регрессии для прогнозирования эффекта изменения определенных независимых переменных. Логистическая Регрессия является статистическим методом, обычно используется для создания прогнозов на основе изменений в независимых переменных:, он используется, например в сценариях финансовой оценки, чтобы спрогнозировать поведение потребителей на основе демографических данных клиента.

В этой задаче вы узнаете, как создать источник данных, который будет использоваться для прогнозов, и сделать прогнозы, которые помогут ответить на несколько вопросов для бизнеса.

Создание данных, используемых для массового прогноза

Существует много способов предоставить входные данные: например, можно импортировать кадровые показатели из электронной таблицы и запустите данных через модель для прогнозирования качества обслуживания на следующий месяц.

На этом занятии вы будете использовать конструктор представлений источников данных для создания именованного запроса. Этот именованный запрос представляет собой нестандартную инструкцию Transact-SQL, которая вычисляет для каждой смены в графике максимальное число операторов, минимальное количество принятых звонков и среднее количество возникших проблем. Затем эти данные будут присоединены к модели интеллектуального анализа данных для получения прогнозов на ближайшее время.

Создание входных данных для массового прогнозирующего запроса

В обозревателе решений щелкните правой кнопкой мыши представления источников данных, а затем выберите новое представление источника данных.
В мастере представлений источников данных выберите Adventure Works DW Multidimensional 2012 как источник данных и нажмите кнопку Далее.
На Выбор таблиц и представлений щелкните Далее не выбирая таблиц.
На Завершение работы мастера Введите имя смены.

Это имя будет выводиться в обозревателе решений в качестве имени для представления источников данных.
Щелкните правой кнопкой мыши пустую панель конструктора, а затем выберите новым именованным запросом.
В Создание именованного запроса диалоговом для имя, тип Shifts for Call Center.

Это имя будет выводиться в качестве имени для именованного запроса только в конструкторе представлений источников данных.

Вставьте следующую инструкцию запроса в текстовую панель SQL в нижней половине диалогового окна.

SELECT DISTINCT WageType, Shift,   
AVG
(Orders) as AvgOrders, MIN
(Orders) as MinOrders, MAX
(Orders) as MaxOrders,  
AVG
(Calls) as AvgCalls, MIN
(Calls) as MinCalls, MAX
(Calls) as MaxCalls,  
AVG
(LevelTwoOperators) as AvgOperators, MIN
(LevelTwoOperators) as MinOperators, MAX
(LevelTwoOperators) as MaxOperators,  
AVG
(IssuesRaised) as AvgIssues, MIN
(IssuesRaised) as MinIssues, MAX
(IssuesRaised) as MaxIssues  
FROM dbo.FactCallCenter  
GROUP BY Shift, WageType

В области конструирования щелкните правой кнопкой мыши таблицу Shifts for Call Center и выберите Просмотр данных для просмотра данных, возвращаемые запросом T-SQL.
Щелкните правой кнопкой мыши вкладку Shifts.dsv (конструктор) и нажмите кнопку Сохранить Сохранить новое определение представления источника данных.

Прогнозирование метрик обслуживания для каждой смены

Теперь, когда для каждой смены создано несколько значений, эти значения будут использоваться в качестве входных данных для вашей модели логистической регрессии для получения некоторых прогнозов, необходимых для планирования.

Использование нового представления источников данных в качестве входных данных для прогнозирующего запроса

В конструкторе интеллектуального анализа данных щелкните Прогнозирование моделей интеллектуального анализа вкладки.
В модель интеллектуального анализа данных панели, щелкните Выбор модели, и выберите Call Center - LR из списка доступных моделей.
Из модель интеллектуального анализа данных меню, снимите флажок, одноэлементный запрос. Появится предупреждение о том, что входные данные одноэлементного запроса будут утеряны. Нажмите кнопку ОК.

Одноэлементного запроса заменяется диалогового Выбор входных таблиц диалоговое окно.
Щелкните Выбор таблицы вариантов.
В выберите таблицу диалоговом selectShifts из списка источников данных. В имя таблицы или представления выберите Shifts for Call Center (он может быть автоматически установлен), а затем щелкните ОК.

Модель интеллектуального анализа данных конструктора обновляется для отображения сопоставления, созданные на основании имена и типы данных столбцов во входных данных и модели.
Щелкните правой кнопкой мыши одну из строк соединения, а затем выберите Изменить соединения.

В этом диалоговом окне можно точно определить, какие столбцы сопоставлены, а какие — нет. Модель интеллектуального анализа данных содержит столбцы Calls, Orders, IssuesRaised и LvlTwoOperators, которые можно сопоставить с любым статистическим выражением, созданным на основе этих столбцов в исходных данных. В этом сценарии сопоставление будет выполняться со средними значениями.
Щелкните пустую ячейку рядом с LevelTwoOperators и выберите Shifts for Call Center.AvgOperators.
Щелкните пустую ячейку рядом с Calls и выберите Shifts for Call Center.AvgCalls. и нажмите кнопку ОК.

Создание прогнозов для каждой смены

В сетке в нижней половине построителя прогнозирующих запросов, щелкните пустую ячейку под источника, а затем выберите смены для центра обработки вызовов.
В пустой ячейке под поле, выберите «SHIFT».
Щелкните следующую пустую линию в сетке и повторите описанную выше процедуру, чтобы добавить другую строку для WageType.
Щелкните следующую пустую строку в сетке. В источника выберите Прогнозирующая функция. В поле выберите Predict.
Перетащите столбец ServiceGrade из модель интеллектуального анализа данных панели сетки, а также в Критерий или аргумент ячейки. В псевдоним введите прогнозируемый уровень обслуживания.
Щелкните следующую пустую строку в сетке. В источника выберите Прогнозирующая функция. В поле выберите PredictProbability.
Перетащите столбец ServiceGrade из модель интеллектуального анализа данных панели сетки, а также в Критерий или аргумент ячейки. В псевдоним введите вероятности.
Щелкните переключитесь в режим просмотра результата запроса для просмотра прогнозов.

В следующей таблице показан образец результатов для каждой смены.

Shift	WageType	Прогнозируемый уровень обслуживания	Вероятность
AM	выходной	0.165	0.377520666
midnight	выходной	0.105	0.364105573
PM1	выходной	0.165	0.40056055
PM2	выходной	0.165	0.338532973
AM	weekday	0.165	0.370847617
midnight	weekday	0.08	0.352999173
PM1	weekday	0.165	0.317419177
PM2	weekday	0.105	0.311672027

Прогнозирование влияния уменьшения времени ответа на уровень обслуживания

Для каждой смены были созданы некоторые средние значения, использующиеся в качестве входных данных для модели логистической регрессии. Но учитывая то, что бизнес-задачей является поддержание показателя прекращенных вызовов в диапазоне 0,00–0,05, результаты не впечатляют.

Поэтому на основе исходной модели, которая показала сильное влияние времени ответа на уровень обслуживания, команда операторов принимает решение сделать несколько прогнозов, чтобы определить, может ли уменьшение среднего времени ответа на звонок повысить качество обслуживания. Например, что произойдет с уровнями обслуживания, если снизить время ответа на звонок до 90 процентов или даже до 80 процентов от текущего?

Легко создать представление источника данных, которое вычисляет среднее время ответа для каждой смены, а затем добавить столбцы, которые вычисляют 80 или 90 процентов среднего времени ответа. Затем представление источника данных можно использовать в качестве входных данных для модели.

Хотя конкретные шаги здесь не показаны, в следующей таблице сравниваются изменения в уровне обслуживания в случае уменьшения времени ответа до 80 и 90 процентов от текущего.

Из этих результатов можно сделать вывод, что для повышения качества обслуживания следует уменьшить время ответа для конкретных смен до 90 процентов от текущего.

Смена, ставка и день	Прогнозируемое качество обслуживания с текущим средним временем ответа.	Прогнозируемое качество обслуживания с 90 процентов сокращение времени ответа	Прогнозируемое качество обслуживания при уменьшении времени ответа до 80 процентов от текущего.
Выходной до полудня	0.165	0,05	0,05
Выходной после полудня 1	0,05	0,05	0,05
Полночь выходного	0.165	0,05	0,05

На основе этой модели можно создать множество других прогнозирующих запросов. Например, можно спрогнозировать количество операторов, требуемое для достижения определенного уровня обслуживания или для ответа на заданное число входящих звонков. Поскольку в модель логистической регрессии можно включить несколько выходных значений, можно легко экспериментировать с различными независимыми переменными и результатами без необходимости создавать множество отдельных моделей.

Замечания

В надстройках интеллектуального анализа данных для Excel 2007 имеются мастера логистической регрессии, которые помогают получить ответы на сложные вопросы, например определение числа операторов второго уровня, требуемого для повышения показателя обслуживания до заданного уровня для определенной смены. Надстройки интеллектуального анализа данных загружаются бесплатно и содержат мастера на базе алгоритмов нейронной сети или логистической регрессии. Дополнительные сведения см. в следующих разделах.

SQL Server 2005 данных надстройки интеллектуального анализа для Office 2007: поиск решения и что делать, если анализ сценария
SQL Server 2008 данных надстройки интеллектуального анализа для Office 2007: поиск решения анализ сценария, что делать, если анализ сценария и расчет прогноза

Заключение

Рассмотрены создание, настройка и интерпретация моделей интеллектуального анализа данных, основанных на алгоритме нейронной сети (Майкрософт) и алгоритме логистической регрессии (Майкрософт). Эти типы моделей являются сложными и дают практически безграничное разнообразие возможностей анализа, поэтому могут оказаться трудны в освоении.

Тем не менее, эти алгоритмы могут прохода множеством комбинаций факторов и автоматически выявляют сильные корреляции, предоставляя поддержку статистические сведения, которые было бы трудно обнаружить в процессе ручного исследования данных, с помощью Transact-SQL или даже Power Pivot.

См. также:

Примеры запросов модели логистической регрессии
Алгоритм логистической регрессии (Майкрософт)
Алгоритм нейронной сети (Майкрософт)
Примеры запросов к модели нейронной сети

Поделиться через