다음을 통해 공유


콜 센터 모델에 대한 예측 만들기(중급 데이터 마이닝 자습서)

교대조, 전화 상담원 수, 호출 및 서비스 등급에 대한 몇 가지 사항을 배웠으므로 이제 비즈니스 분석 및 계획에 사용할 수 있는 일부 예측 쿼리를 만들 준비가 되었습니다. 먼저 탐구 모델에서 일부 예측을 만들어 몇 가지 가정을 테스트합니다. 다음으로 로지스틱 회귀 모델을 사용하여 대량 예측을 만듭니다.

이 단원에서는 사용자가 예측 쿼리 작성기를 사용하는 방법을 이미 잘 알고 있다고 가정합니다. 예측 쿼리 작성기 사용 방법은 DMX 예측 쿼리 만들기를 참조하십시오.

신경망 모델을 사용하여 예측 만들기

다음 예에서는 탐색을 위해 만든 신경망 모델을 사용하여 단일 예측을 만드는 방법을 보여 줍니다. 단일 예측은 모델에서 서로 다른 값을 사용하여 결과를 살펴볼 수 있는 좋은 방법입니다. 이 시나리오에서는 6명의 경력 전화 상담원이 근무하는 경우 요일을 지정하지 않고 자정 교대조에 대한 서비스 등급을 예측합니다.

신경망 모델을 사용하여 단일 쿼리를 만들려면

  1. Business Intelligence Development Studio에서 사용할 모델이 포함된 솔루션을 엽니다.

  2. 데이터 마이닝 디자이너에서 마이닝 모델 예측 탭을 클릭합니다.

  3. 마이닝 모델 창에서 모델 선택을 클릭합니다.

  4. 마이닝 모델 선택 대화 상자에는 마이닝 구조 목록이 표시됩니다. 마이닝 구조를 확장하여 해당 구조와 연결된 마이닝 모델 목록을 봅니다.

  5. Call Center Default 마이닝 구조를 확장하고 신경망 모델 Call Center - LR을 선택합니다.

  6. 마이닝 모델 메뉴에서 단일 쿼리를 선택합니다.

    단일 쿼리 입력 대화 상자가 표시됩니다. 이 대화 상자의 열은 마이닝 모델의 열에 매핑됩니다.

  7. 단일 쿼리 입력 대화 상자에서 Shift에 대한 행을 클릭한 다음 midnight를 선택합니다.

  8. Lvl 2 Operators에 대한 행을 클릭하고 6을 입력합니다.

  9. 마이닝 모델 예측 탭의 아래쪽 중간에 있는 표에서 첫 번째 행을 클릭합니다.

  10. 원본 열에서 아래쪽 화살표를 클릭하고 예측 함수를 선택합니다. 필드 열에서 PredictHistogram을 선택합니다.

    이 예측 함수와 함께 사용할 수 있는 인수 목록이 조건/인수 상자에 자동으로 나타납니다.

  11. 마이닝 모델 창에 있는 열 목록에서 ServiceGrade 열을 조건/인수 상자로 끌어다 놓습니다.

    열 이름이 자동으로 인수로 삽입됩니다. 이 입력란으로 끌어다 놓을 임의의 예측 가능한 특성 열을 선택할 수 있습니다.

  12. 예측 쿼리 작성기의 위쪽 모퉁이에 있는 쿼리 결과 뷰로 전환 단추를 클릭합니다.

예상 결과에는 각 예측에 대한 지지도 및 확률 값과 함께 이 입력에 따라 각 서비스 등급에 대해 가능한 예측 값이 포함됩니다. 언제든지 디자인 뷰로 돌아가 입력을 변경하거나 더 많은 입력을 추가할 수 있습니다.

로지스틱 회귀 모델을 사용하여 예측 만들기

신경망 모델을 사용하여 예측을 만들 수 있지만 보다 일반적으로는 복잡한 관계를 탐색하는 데 신경망 모델이 사용됩니다. 비즈니스 문제 관련 특성을 이미 알고 있는 경우 로지스틱 회귀 모델을 사용하여 일부 특성을 변경했을 때의 효과를 예측할 수 있습니다. 로지스틱 회귀는 독립 변수의 변경 내용을 기반으로 예측을 만드는 데 일반적으로 사용되는 통계 방법입니다. 예를 들어 로지스틱 회귀는 고객 인구 통계를 기반으로 고객 동작을 예측하기 위해 재무 상태 평가에 사용됩니다.

이 태스크에서는 예측에 사용할 데이터 원본을 만든 다음 여러 가지 비즈니스 질문에 대답하는 데 유용한 예측을 만드는 방법을 배웁니다.

대량 예측에 사용할 데이터 생성

이 시나리오에서는 먼저 대량 예측을 만드는 데 사용할 수 있는 원본 데이터의 집계 보기를 만든 다음 해당 데이터를 예측 쿼리의 마이닝 모델에 조인합니다. 스프레드시트에서 직원 수준을 가져오거나 프로그래밍 방식으로 값을 제공하듯이 여러 방법으로 입력 데이터를 제공할 수 있습니다. 여기에서는 데이터 원본 뷰 디자이너를 사용하여 명명된 쿼리를 만듭니다. 이 명명된 쿼리는 최대 전화 상담원 수, 받은 최소 호출 수 또는 발생한 평균 문제 수와 같이 각 교대조에 대한 집계를 만드는 사용자 지정 T-SQL 문입니다.

대량 예측 쿼리에 대한 입력 데이터를 생성하려면

  1. 솔루션 탐색기에서 데이터 원본 뷰를 마우스 오른쪽 단추로 클릭한 다음 새 데이터 원본 뷰를 선택합니다.

  2. 데이터 원본 뷰 마법사에서 Adventure Works DW2008R2를 데이터 원본으로 선택한 후 다음을 클릭합니다.

  3. 테이블 및 뷰 선택 페이지에서 테이블을 선택하지 않고 다음을 클릭합니다.

  4. 마법사 완료 페이지에서 Shifts라는 이름을 입력합니다.

    이 이름은 솔루션 탐색기에서 데이터 원본 뷰의 이름으로 나타납니다.

  5. 빈 디자인 창을 마우스 오른쪽 단추로 클릭하고 새 명명된 쿼리를 선택합니다.

  6. 명명된 쿼리 만들기 대화 상자에서 이름에 Shifts for Call Center를 입력합니다.

    이 이름은 데이터 원본 뷰 디자이너에 명명된 쿼리의 이름으로만 나타납니다.

  7. 다음 쿼리 문을 대화 상자의 아래쪽 중간에 있는 SQL 텍스트 창에 붙여 넣습니다.

    SELECT DISTINCT WageType, Shift, 
    AVG(Orders) as AvgOrders, MIN(Orders) as MinOrders, MAX(Orders) as MaxOrders,
    AVG(Calls) as AvgCalls, MIN(Calls) as MinCalls, MAX(Calls) as MaxCalls,
    AVG(LevelTwoOperators) as AvgOperators, MIN(LevelTwoOperators) as MinOperators, MAX(LevelTwoOperators) as MaxOperators,
    AVG(Issues) as AvgIssues, MIN(Issues) as MinIssues, MAX(Issues) as MaxIssues
    FROM dbo.FactCallCenter
    GROUP BY Shift, WageType
    
  8. 확인을 클릭합니다..

  9. 다자인 창에서 Shifts for Call Center 테이블을 마우스 오른쪽 단추로 클릭하고 데이터 탐색을 선택하여 T-SQL 쿼리가 반환한 데이터를 미리 봅니다.

  10. Shifts.dsv(디자인) 탭을 마우스 오른쪽 단추로 클릭한 다음 저장을 클릭하여 새 데이터 원본 뷰 정의를 저장합니다.

각 교대조에 대한 서비스 메트릭 예측

지금까지 각 교대조에 대한 일부 값을 생성했으므로 이제는 이러한 값을 작성한 로지스틱 회귀 모델의 입력으로 사용하여 여러 예측을 생성합니다.

새 DSV를 예측 쿼리에 대한 입력으로 사용하려면

  1. 데이터 마이닝 디자이너에서 마이닝 모델 예측 탭을 클릭합니다.

  2. 마이닝 모델 창에서 모델 선택을 클릭하고 사용 가능한 모델 목록에서 Call Cetner - LR을 선택합니다.

  3. 마이닝 모델 메뉴에서 단일 쿼리 옵션의 선택을 취소합니다. 단일 쿼리 입력이 손실된다는 경고가 표시됩니다. 확인을 클릭합니다.

    단일 쿼리 입력 대화 상자가 입력 테이블 선택 대화 상자로 바뀝니다.

  4. 사례 테이블 선택을 클릭합니다.

  5. 테이블 선택 대화 상자의 데이터 원본 목록에서 Shifts를 선택합니다. 테이블/뷰 이름 목록에서 Shifts for Call Center(자동으로 선택될 수 있음)를 선택한 다음 확인을 클릭합니다.

    마이닝 모델 예측 디자인 화면이 입력 데이터 및 모델의 열 이름 및 데이터 형식을 기반으로 하여 Analysis Services에서 생성된 매핑을 표시하도록 업데이트됩니다.

  6. 조인 선을 마우스 오른쪽 단추로 클릭한 다음 연결 수정을 선택합니다.

    이 대화 상자에서는 매핑된 열과 매핑되지 않은 열을 정확하게 볼 수 있습니다. 마이닝 모델에는 Calls, Orders, Issues 및 LvlTwoOperators 열이 포함되어 있으므로 사용자가 원본 데이터의 이 열을 기반으로 만든 집계로 매핑할 수 있습니다. 이 시나리오에서는 평균으로 매핑합니다.

  7. LevelTwoOperators 옆의 빈 셀을 클릭하고 Shifts for Call Center.AvgOperators를 선택합니다.

  8. Calls 옆의 빈 셀을 클릭하고 Shifts for Call Center.AvgCalls를 선택한 다음 확인을 클릭합니다.

각 교대조에 대한 예측을 만들려면

  1. 예측 쿼리 작성기의 아래쪽 중간에 있는 표에서 원본 아래에 있는 빈 셀을 클릭한 다음 Shifts for Call Center를 선택합니다.

  2. 필드 아래의 빈 셀에서 Shift를 선택합니다.

  3. 표의 다음 빈 줄을 클릭하고 위에 설명한 절차를 반복하여 WageType에 대한 다른 행을 추가합니다.

  4. 표에서 다음 빈 줄을 클릭합니다. 원본 열에서 예측 함수를 선택합니다. 필드 열에서 Predict를 선택합니다.

  5. 마이닝 모델 창에서 표 아래로 ServiceGrade 열을 끌고 해당 열을 조건/인수 셀에 놓습니다. 별칭 필드에 Predicted Service Grade를 입력합니다.

  6. 표에서 다음 빈 줄을 클릭합니다. 원본 열에서 예측 함수를 선택합니다. 필드 열에서 PredictProbability를 선택합니다.

  7. 마이닝 모델 창에서 표 아래로 ServiceGrade 열을 끌고 해당 열을 조건/인수 셀에 놓습니다. 별칭 필드에 Probability를 입력합니다.

  8. 쿼리 결과 뷰로 전환을 클릭하여 예측을 봅니다.

다음 표에서는 각 교대조에 대한 결과 예를 보여 줍니다.

교대조

임금 유형

예측된 서비스 등급

확률

AM

holiday

0.165

0.377520666

midnight

holiday

0.105

0.364105573

PM1

holiday

0.165

0.40056055

PM2

holiday

0.165

0.338532973

AM

weekday

0.165

0.370847617

midnight

weekday

0.08

0.352999173

PM1

weekday

0.165

0.317419177

PM2

weekday

0.105

0.311672027

서비스 등급에 통화 시간이 끼치는 영향 예측

지금까지 각 교대조에 대한 일부 값을 생성하고 이러한 값을 로지스틱 회귀 모델의 입력으로 사용했습니다. 그러나 중단율을 0.00-0.05 범위 내로 유지하려는 비즈니스 목표에는 이 결과가 충분하지 않습니다.

따라서 서비스 등급에 대한 응답 시간의 큰 영향력을 보여 준 원래 모델을 기반으로 하여 운영 팀에서는 호출에 응답하는 평균 시간을 줄이면 서비스 등급을 향상시킬 수 있는지를 평가하는 일부 예측을 실행하기로 결정합니다. 예를 들어 현재 통화 응답 시간을 90% 또는 심지어 80%로 줄이면 어떻게 될지 살펴 봅니다.

각 교대조에 대한 평균 응답 시간을 계산하는 DSV(데이터 원본 뷰)를 만드는 것은 간단합니다. 또한 대상 값을 나타내는 시간이 포함된 열을 쉽게 추가할 수 있습니다. 그런 다음 DSV를 모델에 대한 입력으로 사용할 수 있습니다.

다음 표에서는 서로 다른 응답 시간을 입력으로 사용하는 예측 쿼리의 결과를 보여 줍니다. 쿼리는 예측 값의 확률도 반환하기 때문에 응답 시간 감소가 서비스 등급에 영향을 줄 가능성이 높은지 평가할 수 있습니다.

다음 표에서 첫 번째 수 집합은 예측된 서비스 등급을 나타내고 괄호 안에 있는 두 번째 수 집합은 예측된 해당 값의 확률을 나타냅니다. 이러한 결과를 통해 응답 시간을 90%로 줄이는 것이 좋다는 결론을 내릴 수 있습니다.

교대조

임금 유형

교대 평균 응답 시간

응답 시간 90% 감소

응답 시간 80% 감소

AM

holiday

0.165 (0.366079388)

0.05 (0.457470875)

0.05 (0.610514425)

AM

weekday

0.05 (0.341218694)

0.05 (0.475767776)

0.05 (0.60083244)

midnight

holiday

0.165 (0.337801273)

0.05 (0.413774655)

0.05 (0.545764101)

midnight

weekday

0.05 (0.378241537)

0.05 (0.471615415)

0.05 (0.545614362)

PM1

holiday

0.165 (0.457871243)

0.165 (0.376892925)

0.05 (0.359440286)

PM1

weekday

0.08 (0.299182047)

0.08 (0.363761441)

0.08 (0.40686473)

PM2

holiday

0.105 (0.325921785)

0.05 (0.392121793)

0.05 (0.521558758)

PM2

weekday

0.105 (0.436051591)

0.105 (0.342589832)

0.05 (Y)

여기에 나와 있는 대로 입력 값을 데이터 원본 뷰로 제공함은 물론 입력을 프로그래밍 방식으로 계산하고 이를 모델에 제공할 수 있습니다. 가능한 모든 값을 반복하여 각 교대조에 대한 대상 서비스 수준을 보장하는 가장 적은 응답 시간 감소 수치를 찾을 수 있습니다.

모델에서 만들 수 있는 여러 가지 기타 예측 쿼리가 있습니다. 예를 들어 특정 서비스 수준을 만족하기 위해 또는 특정 개수의 들어오는 호출에 응답하기 위해 필요한 전화 상담원 수를 예측할 수 있습니다. 로지스틱 회귀 모델에 여러 출력을 포함할 수 있기 때문에 여러 개별 모델을 만들지 않아도 서로 다른 독립 변수 및 결과를 쉽게 경험할 수 있습니다.

주의

Excel 2007용 데이터 마이닝 추가 기능에서는 로지스틱 회귀 마법사를 제공하기 때문에 서비스 등급을 특정 교대조에 대한 대상 수준으로 개선하는 데 필요한 두 번째 수준의 전화 상담원의 수와 같은 복잡한 질문에 보다 쉽게 대답할 수 있습니다. 데이터 마이닝 추가 기능은 무료로 다운로드할 수 있으며 신경망 및/또는 로지스틱 회귀 알고리즘을 기반으로 하는 마법사를 포함합니다. 자세한 내용은 다음 링크를 참조하십시오.

결론

이 단원에서는 Microsoft 신경망 알고리즘 및 Microsoft 로지스틱 회귀 알고리즘을 기반으로 하는 마이닝 모델을 생성, 사용자 지정 및 해석하는 방법을 배웠습니다. 이러한 모델 유형은 복잡하고 거의 제한 없이 다양하게 분석될 수 있으므로 복잡하고 마스터하기가 어렵습니다. 디자인 원본 뷰 디자이너에서 제공되는 Excel 기반 차트 및 피벗 테이블과 같은 도구를 사용하면 알고리즘에서 검색한 가장 강력한 추세를 지원하고 발견한 추세를 이해할 수 있습니다. 그러나 모델이 나타내는 정보를 정확하게 이해하기 위해 모델에서 제공하는 분석을 탐색하고, 데이터를 약간 깊이 검토하고, 사용자 지정 마이닝 모델 뷰어와 기타 도구 사이를 앞뒤로 이동할 수 있습니다. 이렇게 하면 데이터 추세를 완전히 이해할 수 있습니다.