Изучение модели Call Center (учебник по интеллектуальному анализу данных — средний уровень)
Теперь, когда вы создали исследовательскую модель, ее можно использовать для получения дополнительных сведений о данных с помощью следующих средств, предоставляемых в SQL Server Data Tools (SSDT).
Средство просмотра нейронной сети Майкрософт: это средство просмотра доступно на вкладке "Средство просмотра моделей интеллектуального анализа данных" конструктора интеллектуального анализа данных и предназначено для экспериментов с взаимодействием с данными.
Средство просмотра дерева универсального содержимого Майкрософт: это стандартное средство просмотра содержит подробные сведения о шаблонах и статистике, обнаруженных алгоритмом при создании модели.
Средство просмотра нейронных сетей (Microsoft)
Средство просмотра содержит три области: входные, выходные данные и переменные.
С помощью области вывода можно выбрать различные значения прогнозируемого атрибута или зависимой переменной. Если модель содержит несколько прогнозируемых атрибутов, вы можете выбрать атрибут из списка выходных атрибутов .
В области "Переменные" сравниваются два результата, которые вы выбрали с точки зрения добавления атрибутов или переменных. Цветные линии визуально представляют степень влияния переменной на конечные результаты. Также можно просмотреть оценку точности прогноза для переменных. Оценка точности вычисляется различным образом в зависимости от типа используемой модели интеллектуального анализа данных, но обычно сообщает, как улучшается работа модели в случае использования данного атрибута для прогнозирования.
Область ввода позволяет добавлять в модель факторы влияния, чтобы попробовать различные сценарии "что если".
Использование панели «Выходные данные»
В этой первоначальной модели задачей является изучение влияния различных факторов на уровень обслуживания. Для этого можно выбрать оценку служб из списка выходных атрибутов, а затем сравнить различные уровни службы, выбрав диапазоны из раскрывающихся списков для значения 1 и значения 2.
Сравнение самого низкого и самого высокого уровней обслуживания
Для значения 1 выберите диапазон с наименьшими значениями. Например, диапазон 0-0-0,7 представляет самые низкие показатели вызовов, прекращенных абонентом, что соответствует самому высокому уровню обслуживания.
Примечание.
Значения, фактически присутствующие в этом диапазоне, могут различаться в зависимости от конфигурации модели.
Для значения 2 выберите диапазон с самыми высокими значениями. Например, диапазон со значением >=0,12 представляет самую высокую частоту отказов и, следовательно, худший уровень обслуживания. Другими словами, 12 % клиентов, позвонивших за эту смену, повесили трубку до разговора с представителем компании.
Содержимое области переменных обновляется для сравнения атрибутов , которые вносят вклад в значения результатов. Поэтому в левом столбце показаны атрибуты, связанные с самым высоким уровнем обслуживания, а в правом столбце — атрибуты, связанные с самым низким уровнем обслуживания.
Использование панели «Переменные»
В этой модели видно, что Average Time Per Issue
это важный фактор. Эта переменная указывает среднее время, затрачиваемое на ответ на звонок, независимо от его типа.
Просмотр и копирование вероятности и оценки точности прогноза для атрибута
В области переменных наведите указатель мыши на цветную панель в первой строке.
Эта цветная панель показывает, насколько сильно
Average Time Per Issue
влияет на уровень обслуживания. В подсказке выводится общая оценка, значения вероятности и оценка точности прогноза для каждого сочетания переменной и конечного результата.На панели "Переменные" щелкните правой кнопкой мыши любую цветную панель и выберите "Копировать".
На листе Excel щелкните правой кнопкой мыши любую ячейку и выберите " Вставить".
Отчет будет вставлен в виде HTML-таблицы, где показаны только оценки для каждой полосы.
На другом листе Excel щелкните правой кнопкой мыши любую ячейку и выберите " Вставить специальное".
Отчет будет вставлен в текстовом формате, и будут показаны связанные статистические данные, описанные в следующем разделе.
Использование панели «Входные данные»
Предположим, что нужно изучить влияние отдельного фактора, например смены или количества операторов. Вы можете выбрать определенную переменную с помощью области ввода , а панель "Переменные " автоматически обновляется, чтобы сравнить две ранее выбранные группы с указанной переменной.
Просмотр влияния, оказываемого изменением входных атрибутов на уровень обслуживания
В области входных данных для атрибута нажмите клавиши SHIFT.
Для параметра "Значение" выберите AM.
Область переменных обновляется, чтобы показать влияние на модель при смене AM. Все остальные выборы остаются неизменными . Вы по-прежнему сравниваете самые низкие и самые высокие оценки обслуживания.
Для параметра "Значение" выберите PM1.
Область переменных обновляется, чтобы показать влияние на модель при изменении смены.
В области ввода щелкните следующую пустую строку в разделе "Атрибут" и выберите "Вызовы". Для параметра Value выберите диапазон, указывающий наибольшее количество вызовов.
В список будет добавлено новое входное условие. Область переменных обновляется, чтобы показать влияние на модель для определенной смены, когда объем вызова является самым высоким.
Продолжайте изменять значения Shift и Calls, чтобы обнаружить содержательные взаимосвязи между сменой, количеством звонков и уровнем обслуживания.
Примечание.
Чтобы очистить область ввода , чтобы использовать различные атрибуты, нажмите кнопку "Обновить содержимое средства просмотра".
Интерпретация статистических данных, представленных в средстве просмотра
При увеличенном времени ожидания можно уверенно прогнозировать высокий показатель вызовов, прекращенных абонентом во время ожидания, что свидетельствует о низком уровне обслуживания. Такое заключение может показаться самоочевидным, однако модель интеллектуального анализа данных предоставляет также дополнительные статистические данные, позволяющие интерпретировать подобные тренды.
Оценка: значение, указывающее общую важность этой переменной для дискриминации результатов. Чем выше оценка, тем сильнее влияние переменной на результат.
Вероятность значения 1: процент, представляющий вероятность этого значения для этого результата.
Вероятность значения 2: процент, представляющий вероятность этого значения для этого результата.
Лифт для значения 1 и лифт для значения 2: оценки, представляющие влияние использования этой конкретной переменной для прогнозирования результатов value 1 и Value 2. Чем выше оценка, тем лучше данная переменная подходит для прогнозирования результатов.
В следующей таблице приведены несколько примеров значений для самых важных факторов. Например, вероятность значения 1 составляет 60,6%, а вероятность значения 2 составляет 8,30%, то есть, когда среднее время на проблему было в диапазоне от 44 до 70 минут, 60,6% случаев были в смене с наивысшими классами обслуживания (значение 1), а 8,30% случаев были в смене с худшими классами обслуживания (значение 2).
По этим данным можно сделать ряд заключений. Меньшее время ответа на звонок (в диапазоне 44–70) сильно влияет на повышение уровня обслуживания (диапазон 0,00–0,07). Оценка (92.35) сообщает, что данная переменная является очень важной.
Однако в списке влияющих факторов присутствуют и другие факторы, воздействие которых менее заметно и более сложно для интерпретации. Например, смена влияет на качество обслуживания, однако оценка точности прогноза и относительные значения вероятности показывают, что смена не является важным фактором.
Атрибут | Значение | Благоприятно < 0.07 | >Пользу = 0,12 |
---|---|---|---|
Средние затраты времени на решение проблемы | 89.087 - 120.000 | Оценка: 100 Вероятность значения1: 4,45 % Вероятность значения2: 51,94 % Лифт для значения1: 0.19 Лифт для value2: 1.94 |
|
Средние затраты времени на решение проблемы | 44.000 - 70.597 | Оценка: 92.35 Вероятность значения1: 60,06 % Вероятность значения2: 8,30 % Лифт для значения1: 2.61 Лифт для value2: 0.31 |
Средство просмотра дерева универсального содержимого Майкрософт
Это средство просмотра предназначено для вывода еще более подробных сведений, полученных алгоритмом во время обработки модели. Средство просмотра дерева содержимого MicrosoftGeneric представляет модель интеллектуального анализа данных в виде ряда узлов, в которых каждый узел представляет знания об обучающих данных. Это средство просмотра может использоваться с любыми моделями, однако содержимое узлов различается в зависимости от типа модели.
Для моделей нейронной сети или логистической регрессии может оказаться особенно полезным marginal statistics node
. Этот узел содержит выведенные статистические сведения о распределении значений в данных. Эти сведения могут быть полезны, если нужно получить сводное представление о данных, не создавая большое количество запросов T-SQL. Диаграмма распределения значений по сегментам в предыдущем разделе была получена из граничного узла статистики.
Получение сводки по значениям данных из модели интеллектуального анализа данных
В конструкторе интеллектуального анализа данных на вкладке "Средство просмотра моделей интеллектуального анализа данных" выберите <имя> модели интеллектуального анализа данных.
В списке просмотра выберите средство просмотра дерева содержимого Майкрософт.
Представление модели интеллектуального анализа данных обновится и будет отображать иерархию узлов в левой панели и HTML-таблицу в правой панели.
В области заголовка узла щелкните узел с именем 100000000000000000000000000.
Самый верхний узел в любой модели всегда является ее корневым узлом. В модели нейронной сети или логистической регрессии граничный узел статистики расположен непосредственно под корневым узлом.
В области сведений о узле прокрутите вниз, пока не найдете строку, NODE_DISTRIBUTION.
Прокрутите таблицу NODE_DISTRIBUTION, чтобы просмотреть распределение значений, вычисленное алгоритмом нейронной сети.
Чтобы использовать эти данные в отчете, можно выделить и скопировать сведения из отдельных строк или использовать следующий запрос расширений интеллектуального анализа данных для извлечения полного содержимого узла.
SELECT *
FROM [Call Center EQ4].CONTENT
WHERE NODE_NAME = '10000000000000000'
Также можно использовать иерархию узлов и данные из таблицы NODE_DISTRIBUTION, чтобы пройти по определенным путям в нейронной сети и просмотреть статистику скрытого слоя. Дополнительные сведения см. в примерах запросов модели нейронной сети.
Следующая задача занятия
См. также
Содержимое модели интеллектуального анализа данных для моделей нейронной сети (службы Analysis Services — интеллектуальный анализ данных)
Примеры запросов к модели нейронной сети
Технический справочник по алгоритму нейронной сети (Майкрософт)
Изменение дискретизации столбца в модели интеллектуального анализа данных