콜 센터 데이터의 데이터 원본 뷰 추가(중급 데이터 마이닝 자습서)
이 태스크에서는 콜 센터 데이터에 액세스하는 데 사용할 데이터 원본 뷰를 추가합니다. 탐색을 위한 초기 신경망 모델과 권장하는 데 사용할 로지스틱 회귀 모델 모두를 작성하는 데 동일한 데이터가 사용됩니다.
또한 데이터 원본 뷰 디자이너를 사용하여 요일에 대한 열을 추가합니다. 이는 원본 데이터가 콜 센터 데이터를 날짜별로 추적하더라도 해당 요일이 평일 또는 주중인지 여부에 따라 호출량 및 서비스 품질 측면 모두에 경험적으로 되풀이되는 패턴이 있기 때문입니다.
절차
데이터 원본 뷰를 추가하려면
솔루션 탐색기에서 데이터 원본 뷰를 마우스 오른쪽 단추로 클릭하고 새 데이터 원본 뷰를 선택합니다.
데이터 원본 뷰 마법사가 열립니다.
데이터 원본 뷰 마법사 시작 페이지에서 다음을 클릭합니다.
데이터 원본 선택 페이지의 관계형 데이터 원본에서 Adventure Works DW Multidimensional 2012 데이터 원본을 선택합니다. 이 데이터 원본이 없을 경우 기본 데이터 마이닝 자습서를 참조하십시오. 다음을 클릭합니다.
테이블 및 뷰 선택 페이지에서 다음 테이블을 선택하고 오른쪽 화살표를 클릭하여 데이터 원본 뷰에 추가합니다.
FactCallCenter(dbo)
DimDate
다음을 클릭합니다.
마법사 완료 페이지에서는 기본적으로 데이터 원본 뷰의 이름이 Adventure Works DW Multidimensional 2012 로 지정되어 있습니다. 이름을 CallCenter로 변경한 다음 마침을 클릭합니다.
데이터 원본 뷰 디자이너가 열리면서 CallCenter 데이터 원본 뷰가 표시됩니다.
데이터 원본 뷰 창 안쪽을 마우스 오른쪽 단추로 클릭하고 테이블 추가/제거를 선택합니다. DimDate 테이블을 선택한 다음 확인을 클릭합니다.
관계는 각 테이블의 DateKey 열 간에 자동으로 추가되어야 합니다. 이 관계를 사용하여 DimDate 테이블에서 EnglishDayNameOfWeek 열을 얻어 이를 모델에 사용합니다.
데이터 원본 뷰 디자이너에서 FactCallCenter 테이블을 마우스 오른쪽 단추로 클릭하고 새 명명된 계산을 선택합니다.
명명된 계산 만들기 대화 상자에서 다음 값을 입력합니다.
열 이름
DayOfWeek
설명
DimDate 테이블에서 요일을 얻음
식
(SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)
해당 식이 필요한 데이터를 생성하는지 확인하려면 FactCallCenter 테이블을 마우스 오른쪽 단추로 클릭한 다음 데이터 탐색을 선택합니다.
데이터가 사용 가능한지 검토하는 데에 1분 정도 소요되며, 이를 통해 데이터 마이닝에 해당 데이터가 어떻게 사용되는지 알 수 있습니다.
열 이름 |
포함 |
---|---|
FactCallCenterID |
데이터를 데이터 웨어하우스로 가져올 때 만든 임의 키입니다. 이 열은 고유 레코드를 식별하며 데이터 마이닝 모델에 대한 사례 키로 사용해야 합니다. |
DateKey |
콜 센터 운영 날짜로, 정수로 표시됩니다. 정수 날짜 키는 데이터 웨어하우스에서 종종 사용되지만, 날짜 값으로 그룹화하려는 경우 날짜/시간 형식으로 날짜를 구할 수도 있습니다. 공급업체에서 각 운영일의 각 교대조에 대해 별도의 보고서를 제공하기 때문에 날짜는 고유하지 않습니다. |
WageType |
날짜가 평일인지, 아니면 주말 또는 공휴일인지를 나타냅니다. 주말과 평일 간에 고객 서비스 품질에 차이가 있을 수 있으므로 이 열을 입력으로 사용합니다. |
Shift |
통화를 기록한 교대조를 나타냅니다. 이 콜 센터는 영업일을 4개의 교대조인 오전, 오후 1, 오후 2 및 자정으로 나눕니다. 교대조가 고객 서비스 품질에 영향을 줄 수 있으므로 이를 입력으로 사용합니다. |
LevelOneOperators |
근무 중인 첫 번째 수준의 전화 상담원 수를 나타냅니다. 콜 센터 직원은 첫 번째 수준부터 시작하므로 이러한 직원은 덜 숙련되어 있습니다. |
LevelTwoOperators |
근무 중인 두 번째 수준의 전화 상담원 수를 나타냅니다. 직원이 두 번째 수준의 전화 상담원이 되기 위해서는 특정 서비스 시간을 기록해야 합니다. |
TotalOperators |
교대조 동안 근무하는 총 전화 상담원 수입니다. |
Calls |
교대조 동안 받은 호출 수입니다. |
AutomaticResponses |
자동 호출 처리 시스템인 IVR(Interactive Voice Response)을 통해 완전히 처리된 호출 수입니다. |
Orders |
호출 결과로 발생한 주문 수입니다. |
IssuesRaised |
호출로 인해 생성된 후속 작업이 필요한 문제 수입니다. |
AverageTimePerIssue |
들어오는 호출에 응답하는 데 필요한 평균 시간입니다. |
ServiceGrade |
일반적인 서비스 품질을 나타내는 메트릭으로, 전체 교대조에 대한 중단율로 측정됩니다. 중단율이 높을수록 고객이 불만을 느끼며 잠재 주문 기회를 놓칠 가능성이 높습니다. |
데이터에는 단일 날짜 열을 기반으로 한 네 개의 서로 다른 열인 WageType, DayOfWeek, Shift 및 DateKey가 포함되어 있습니다. 일반적으로 데이터 마이닝에서는 동일한 데이터로부터 파생된 여러 열을 사용하는 것이 바람직하지 않습니다. 이는 값들이 서로 너무 강한 상관 관계를 갖고 있으며 기타 패턴을 명확하게 나타내지 못할 수 있기 때문입니다.
그러나 DateKey의 경우 너무 많은 고유 값이 포함되어 있으므로 이를 모델에서 사용하지 않습니다. Shift 및 DayOfWeek 사이에는 직접적인 관계가 없으며, WageType 및 DayOfWeek는 부분적으로만 관련되어 있습니다. 공선성에 대해 염려되는 경우 사용 가능한 전체 열을 사용하여 구조를 만든 다음 각 모델의 서로 다른 열을 무시하고 그 영향을 시험할 수 있습니다.
단원의 다음 태스크
신경망 구조 및 모델 만들기(중급 데이터 마이닝 자습서)