콜 센터 모델에 대한 예측 만들기(중급 데이터 마이닝 자습서)
교대조, 요일, 전화 통화와 주문 수 및 서비스 등급에 대한 몇 가지 사항을 배웠으므로 이제 비즈니스 분석 및 계획에 사용할 수 있는 일부 예측 쿼리를 만들 준비가 되었습니다. 먼저 탐구 모델에서 일부 예측을 만들어 몇 가지 가정을 테스트합니다. 다음으로 로지스틱 회귀 모델을 사용하여 대량 예측을 만듭니다.
이 단원에서는 사용자가 예측 쿼리 작성기를 사용하는 방법을 이미 잘 알고 있다고 가정합니다. 예측 쿼리 작성기 사용 방법은 DMX 예측 쿼리 만들기를 참조하십시오.
신경망 모델을 사용하여 예측 만들기
다음 예에서는 탐색을 위해 만든 신경망 모델을 사용하여 단일 예측을 만드는 방법을 보여 줍니다. 단일 예측은 모델에서 서로 다른 값을 사용하여 결과를 살펴볼 수 있는 좋은 방법입니다. 이 시나리오에서는 6명의 경력 전화 상담원이 근무하는 경우 요일을 지정하지 않고 자정 교대조에 대한 서비스 등급을 예측합니다.
신경망 모델을 사용하여 단일 쿼리를 만들려면
Business Intelligence Development Studio에서 사용할 모델이 포함된 솔루션을 엽니다.
데이터 마이닝 디자이너에서 마이닝 모델 예측 탭을 클릭합니다.
마이닝 모델 창에서 모델 선택을 클릭합니다.
마이닝 모델 선택 대화 상자에는 마이닝 구조 목록이 표시됩니다. 마이닝 구조를 확장하여 해당 구조와 연결된 마이닝 모델 목록을 봅니다.
Call Center 마이닝 구조를 확장하고 Call Center - NN 마이닝 모델을 선택합니다.
마이닝 모델 메뉴에서 단일 쿼리를 선택합니다.
단일 쿼리 입력 대화 상자가 표시됩니다. 이 대화 상자의 열은 마이닝 모델의 열에 매핑됩니다.
단일 쿼리 입력 대화 상자에서 Shift에 대한 행을 클릭하고 midnight를 선택합니다.
Lvl 2 Operators에 대한 행을 클릭하고 6을 입력합니다.
마이닝 모델 예측 탭의 아래쪽 중간에 있는 표에서 첫 번째 행을 클릭합니다.
원본 열을 클릭한 다음 예측 함수를 선택합니다. 필드 열에서 PredictHistogram을 선택합니다.
이 예측 함수와 함께 사용할 수 있는 인수 목록이 조건/인수 상자에 자동으로 나타납니다.
마이닝 모델 창에 있는 열 목록에서 ServiceGrade 열을 조건/인수 상자로 끌어다 놓습니다.
열 이름이 자동으로 인수로 삽입됩니다. 모든 예측 가능한 특성 열을 이 입력란으로 끌어다 놓을 수 있습니다.
예측 쿼리 작성기의 위쪽 모퉁이에 있는 쿼리 결과 뷰로 전환 단추를 클릭합니다.
예상 결과에는 각 예측에 대한 지지도 및 확률 값과 함께 이 입력에 따라 각 서비스 등급에 대해 가능한 예측 값이 포함됩니다. 언제든지 디자인 뷰로 돌아가 입력을 변경하거나 더 많은 입력을 추가할 수 있습니다.
로지스틱 회귀 모델을 사용하여 예측 만들기
신경망 모델을 사용하여 예측을 만들 수 있지만 보다 일반적으로는 복잡한 관계를 탐색하는 데 신경망 모델이 사용됩니다. 비즈니스 문제 관련 특성을 이미 알고 있는 경우 로지스틱 회귀 모델을 사용하여 특정 독립 변수를 변경했을 때의 효과를 예측할 수 있습니다. 로지스틱 회귀는 일반적으로 고객 인구 통계 또는 기타 특성을 기반으로 하여 고객 동작을 예측하기 위해 재무 상태 평가 등의 시나리오에 사용됩니다.
이 태스크에서는 예측에 사용할 데이터 원본을 만든 다음 여러 가지 비즈니스 질문에 응답할 수 있는 유용한 예측을 만드는 방법을 배웁니다.
대량 예측에 사용할 데이터 생성
이 시나리오에서는 먼저 대량 예측을 만드는 데 사용할 수 있는 원본 데이터의 집계 보기를 만든 다음 해당 데이터를 예측 쿼리의 마이닝 모델에 조인합니다. 스프레드시트에서 직원 수준을 가져오거나 프로그래밍 방식으로 값을 제공하듯이 여러 방법으로 입력 데이터를 제공할 수 있습니다. 여기서는 간단하게 보여 주기 위해 데이터 원본 뷰 디자이너를 사용하여 명명된 쿼리를 만듭니다. 이 명명된 쿼리는 최대 전화 상담원 수, 받은 최소 호출 수 또는 발생한 평균 문제 수와 같이 각 교대조에 대한 집계를 만드는 사용자 지정 T-SQL 문입니다.
대량 예측 쿼리에 대한 입력 데이터를 생성하려면
솔루션 탐색기에서 데이터 원본 뷰를 마우스 오른쪽 단추로 클릭하고 새 데이터 원본 뷰를 선택합니다.
데이터 원본 뷰 마법사에서 AdventureWorks DW 2008를 데이터 원본으로 선택한 후 다음을 클릭합니다.
테이블 및 뷰 선택 페이지에서 테이블을 선택하지 않고 다음을 클릭합니다.
마법사 완료 페이지에서 Shifts라는 이름을 입력합니다.
이 이름은 솔루션 탐색기에서 데이터 원본 뷰의 이름으로 나타납니다.
빈 디자인 창을 마우스 오른쪽 단추로 클릭하고 새 명명된 쿼리를 선택합니다.
명명된 쿼리 만들기 대화 상자에서 이름에 Shifts for Call Center를 입력합니다.
이 이름은 데이터 원본 뷰 디자이너에 명명된 쿼리의 이름으로만 나타납니다.
다음 쿼리 문을 대화 상자의 아래쪽 중간에 있는 SQL 텍스트 창에 붙여 넣습니다.
SELECT DISTINCT WageType, Shift, AVG(Orders) as AvgOrders, MIN(Orders) as MinOrders, MAX(Orders) as MaxOrders, AVG(Calls) as AvgCalls, MIN(Calls) as MinCalls, MAX(Calls) as MaxCalls, AVG(LevelTwoOperators) as AvgOperators, MIN(LevelTwoOperators) as MinOperators, MAX(LevelTwoOperators) as MaxOperators, AVG(IssuesRaised) as AvgIssues, MIN(IssuesRaised) as MinIssues, MAX(IssuesRaised) as MaxIssues FROM dbo.FactCallCenter GROUP BY Shift, WageType
확인을 클릭합니다.
다자인 창에서 Shifts for Call Center 테이블을 마우스 오른쪽 단추로 클릭하고 데이터 탐색을 선택하여 T-SQL 쿼리가 반환한 데이터를 미리 봅니다.
Shifts.dsv(디자인) 탭을 마우스 오른쪽 단추로 클릭하고 저장을 클릭하여 새 데이터 원본 뷰 정의를 저장합니다.
각 교대조에 대한 서비스 메트릭 예측
지금까지 각 교대조에 대한 일부 값을 생성했으므로 이제는 이러한 값을 작성한 로지스틱 회귀 모델의 입력으로 사용하여 여러 예측을 생성합니다.
새 DSV를 예측 쿼리에 대한 입력으로 사용하려면
데이터 마이닝 디자이너에서 마이닝 모델 예측 단추 탭을 클릭합니다.
마이닝 모델 창에서 모델 선택을 클릭하고 사용 가능한 모델 목록에서 Call Center - LR을 선택합니다.
마이닝 모델 메뉴에서 단일 쿼리 옵션의 선택을 취소합니다. 단일 쿼리 입력이 손실된다는 경고가 표시됩니다. 확인을 클릭합니다.
단일 쿼리 입력 대화 상자가 입력 테이블 선택 대화 상자로 바뀝니다.
사례 테이블 선택을 클릭합니다.
테이블 선택 대화 상자의 데이터 원본 목록에서Shifts를 선택합니다. 테이블/뷰 이름 목록에서 Shifts for Call Center(자동으로 선택될 수 있음)를 선택하고 확인을 클릭합니다.
마이닝 모델 예측 디자인 화면이 입력 데이터 및 모델의 열 이름 및 데이터 형식을 기반으로 하여 Analysis Services에서 생성된 매핑을 표시하도록 업데이트됩니다.
조인 선을 마우스 오른쪽 단추로 클릭하고 연결 수정을 선택합니다.
이 대화 상자에서는 매핑된 열과 매핑되지 않은 열을 정확하게 볼 수 있습니다. 마이닝 모델에는 Calls, Orders, IssuesRaised 및 LvlTwoOperators 열이 포함되어 있으므로 사용자가 원본 데이터의 이 열을 기반으로 만든 집계로 매핑할 수 있습니다. 이 시나리오에서는 평균으로 매핑합니다.
LevelTwoOperators 옆의 빈 셀을 클릭하고 Shifts for Call Center.AvgOperators를 선택합니다.
Calls 옆의 빈 셀을 클릭하고 Shifts for Call Center.AvgCalls를 선택합니다. 확인을 클릭합니다.
각 교대조에 대한 예측을 만들려면
예측 쿼리 작성기의 아래쪽 중간에 있는 표에서 원본 아래에 있는 빈 셀을 클릭하고 Shifts for Call Center를 선택합니다.
필드 아래의 빈 셀에서 Shift를 선택합니다.
표의 다음 빈 줄을 클릭하고 방금 설명한 절차를 반복하여 WageType에 대한 다른 행을 추가합니다.
표에서 다음 빈 줄을 클릭합니다. 원본에 대해 예측 함수를 선택합니다. 필드에 대해 PREDICT를 선택합니다.
마이닝 모델 창에서 표 아래로 ServiceGrade 열을 아래로 끌어서 표의 조건/인수 셀에 놓습니다. 별칭 필드에 Predicted Service Grade를 입력합니다.
표에서 다음 빈 줄을 클릭합니다. 원본에 대해 예측 함수를 선택합니다. 필드에 대해 PredictProbability를 선택합니다.
다시 마이닝 모델 창에서 ServiceGrade 열을 아래로 끌어서 표의 조건/인수 셀에 놓습니다. 별칭 필드에 Probability를 입력합니다.
쿼리 결과 뷰로 전환을 클릭하여 예측을 봅니다.
다음 표에서는 각 교대조에 대한 결과 예를 보여 줍니다.
교대조 |
임금 유형 |
예측된 서비스 등급 |
확률 |
---|---|---|---|
오전 |
휴일 |
0.109136059911771 |
0.988372093023256 |
자정 |
휴일 |
0.102997190221556 |
0.988372093023256 |
오후1 |
휴일 |
0.118717846218269 |
0.988372093023256 |
오후2 |
휴일 |
0.129285352721855 |
0.988372093023256 |
오전 |
평일 |
0.0818812064002576 |
0.988372093023256 |
자정 |
평일 |
0.0708461247735892 |
0.988372093023256 |
오후1 |
평일 |
0.0902827481812303 |
0.988372093023256 |
오후2 |
평일 |
0.101794450305237 |
0.988372093023256 |
서비스 등급에 통화 시간이 미치는 영향 예측
원래의 비즈니스 목표는 중단율을 0.00-0.05의 목표 범위 내로 유지하는 방법을 결정하는 것이었습니다. 탐색을 위해 개발한 신경망 모델은 통화 응답 시간이 서비스 등급에 많은 영향을 준다는 것을 보여 줍니다. 따라서 전화 상담 팀에서는 평균 통화 응답 시간을 줄이면 서비스 등급이 향상될지 여부를 평가하기 위해 몇 가지 예측을 실행하기로 결정했습니다. 예를 들어 현재 통화 응답 시간을 90% 또는 심지어 80%로 줄이면 어떻게 될지 살펴봅니다.
각 교대조의 평균 응답 시간을 계산하는 DSV(데이터 원본 뷰)를 만드는 것은 간단합니다. 그런 다음에는 해당 평균 응답 시간의 백분율을 계산하는 열을 추가합니다. 그런 다음 DSV를 모델에 대한 입력으로 사용할 수 있습니다.
예를 들어 다음 표에서는 실제 데이터의 평균, 실제 값의 90%를 나타내는 값, 평균 통화 응답 시간의 80%를 나타내는 값의 세 가지 응답 시간을 입력으로 사용하는 예측 쿼리의 결과를 보여 줍니다.
이 결과에서 각 열의 첫 번째 예측 집합은 예측된 서비스 등급을 나타내고 괄호 안에 있는 두 번째 숫자 집합은 예측된 해당 값의 확률을 나타냅니다. 이러한 결과를 통해 응답 시간을 90%로 줄이는 것이 가장 비용 효과적인 해결 방법이라는 결론을 내릴 수 있습니다.
교대조 |
임금 유형 |
교대조별 평균 호출 응답 시간 |
응답 시간을 현재 시간의 90%로 줄이기 |
응답 시간을 현재 시간의 80%로 줄이기 |
---|---|---|---|---|
AM |
holiday |
0.165 (0.366079388) |
0.05 (0.457470875) |
0.05 (0.610514425) |
AM |
weekday |
0.05 (0.341218694) |
0.05 (0.475767776) |
0.05 (0.60083244) |
midnight |
holiday |
0.165 (0.337801273) |
0.05 (0.413774655) |
0.05 (0.545764101) |
midnight |
weekday |
0.05 (0.378241537) |
0.05 (0.471615415) |
0.05 (0.545614362) |
PM1 |
holiday |
0.165 (0.457871243) |
0.165 (0.376892925) |
0.05 (0.359440286) |
PM1 |
weekday |
0.08 (0.299182047) |
0.08 (0.363761441) |
0.08 (0.40686473) |
PM2 |
holiday |
0.105 (0.325921785) |
0.05 (0.392121793) |
0.05 (0.521558758) |
PM2 |
weekday |
0.105 (0.436051591) |
0.105 (0.342589832) |
0.05 (Y) |
여기에 나와 있는 대로 입력 값을 데이터 원본 뷰로 제공함은 물론 입력을 프로그래밍 방식으로 계산하고 이를 모델에 제공할 수 있습니다. 가능한 모든 값을 반복하여 각 교대조에 대한 대상 서비스 수준을 보장하는 가장 적은 응답 시간 감소 수치를 찾을 수 있습니다.
모델에서 만들 수 있는 여러 가지 기타 예측 쿼리가 있습니다. 예를 들어 특정 서비스 수준을 만족하기 위해 또는 특정 개수의 들어오는 호출에 응답하기 위해 필요한 전화 상담원 수를 예측할 수 있습니다. 로지스틱 회귀 모델에 여러 출력을 포함할 수 있기 때문에 여러 개별 모델을 만들지 않아도 서로 다른 독립 변수 및 결과를 쉽게 경험할 수 있습니다.
주의
Excel 2007용 데이터 마이닝 추가 기능에서는 로지스틱 회귀 마법사를 제공하기 때문에 서비스 등급을 특정 교대조에 대한 대상 수준으로 개선하는 데 필요한 두 번째 수준의 전화 상담원의 수와 같은 복잡한 질문에 보다 쉽게 대답할 수 있습니다. 데이터 마이닝 추가 기능은 무료로 다운로드할 수 있으며 신경망 및/또는 로지스틱 회귀 알고리즘을 기반으로 하는 마법사를 포함합니다. 자세한 내용은 다음 링크를 참조하십시오.
Office 2007용 SQL Server 2005 데이터 마이닝 추가 기능(SQL Server 2005 Data Mining Add-Ins for Office 2007): 목표 검색 및 가상 시나리오 분석
Office 2007용 SQL Server 2008 데이터 마이닝 추가 기능(SQL Server 2008 Data Mining Add-Ins for Office 2007): 목표 검색 시나리오 분석, 가상 시나리오 분석 및 예측 계산기
결론
이 단원에서는 Microsoft 신경망 알고리즘 및 Microsoft 로지스틱 회귀 알고리즘을 기반으로 하는 마이닝 모델을 생성, 사용자 지정 및 해석하는 방법을 배웠습니다. 이러한 모델 유형은 복잡하고 거의 제한 없이 다양하게 분석될 수 있으므로 복잡하고 마스터하기가 어렵습니다. 디자인 원본 뷰 디자이너에서 제공되는 Excel 기반 차트 및 피벗 테이블과 같은 도구를 사용하면 알고리즘에서 검색한 가장 강력한 추세를 지원하고 발견한 추세를 이해할 수 있습니다. 그러나 모델이 나타내는 정보를 정확하게 이해하려면 모델에서 제공하는 분석을 탐색하고, 데이터를 약간 깊이 검토하고, 사용자 지정 마이닝 모델 뷰어와 기타 도구 사이를 앞뒤로 이동하여 데이터 추세를 완전히 이해해야 합니다.
참고 항목
개념
변경 내역
업데이트된 내용 |
---|
업데이트된 시나리오와 일치하도록 예측 및 DDL 문에서 마이닝 모델 이름을 수정했습니다. |
Issues의 열 이름을 수정했습니다. DayOfWeek가 포함된 모델을 사용하도록 예제 결과를 업데이트했습니다. 최종 예측 시나리오에 대한 설명을 추가했습니다. |