중급 데이터 마이닝 자습서(Analysis Services - 데이터 마이닝)
Microsoft Analysis Services는 데이터 마이닝 모델을 만들고 작업하기 위한 통합 환경을 제공합니다. 데이터 원본에 쉽게 바인딩하고, 여러 모델을 만들어 같은 데이터에 대해 테스트하고, 예측 분석에 사용할 모델을 배포할 수 있습니다.
기본 데이터 마이닝 자습서에서는 Business Intelligence Development Studio를 사용하여 데이터 마이닝 솔루션을 만드는 방법을 학습하고, 고객 구매 행동을 분석하고 잠재적인 구매자를 대상으로 하는 대상 메일 캠페인을 지원하는 3개의 모델을 작성했습니다.
다음 자습서를 완료하려면 기본 데이터 마이닝 자습서에서 소개한 마이닝 모델 뷰어 및 데이터 마이닝 도구에 익숙해야 합니다. 이 중급 자습서는 이러한 기본 자습서를 기반으로 작성되었으며 예측 및 시장 바구니 분석을 비롯하여 여러 가지 새로운 시나리오를 소개합니다. 시계열 모델, 연결 모델 및 시퀀스 클러스터링 모델을 만드는 방법에 대해 설명합니다. 또한 모델에서 중첩 테이블을 사용하고 중첩 테이블에 필터를 만드는 방법에 대해 설명합니다.
모든 시나리오는 AdventureWorksDW2008R2 데이터 원본을 사용하지만 시나리오마다 다른 데이터 원본 뷰를 만듭니다. 데이터 원본을 먼저 만들면 순서에 관계없이 단원을 학습할 수 있습니다.
단원은 독립적이며 별도로 완료할 수 있습니다.
단원 시나리오
대상 메일 캠페인이 성공하면 비즈니스 계획에 사용하기 위해 여러 새로운 모델을 개발하는 데 학습한 데이터 마이닝 정보를 적용할 것인지 묻는 메시지가 표시됩니다. 여기에는 다음과 같은 새로운 모델 유형이 포함됩니다.
전세계의 여러 지역에서 제품 판매를 예측하는 시계열 모델. 각 지역에 대한 개별 모델과 교차 예측에 사용할 수 있는 일반 모델을 개발합니다.
Adventure Works Cycles 전자 상거래 사이트를 방문하는 동안 구매한 제품 그룹을 분석하는 연결 모델. 이 시장 바구니 모델을 기반으로 하여 고객에게 제품을 권장할 수 있습니다.
고객이 제품을 구매한 순서를 분석하는 시퀀스 클러스터링 모델. 이 모델을 기반으로 하여 웹 사이트 디자인 또는 새 제품의 변경 사항을 계획할 수 있습니다.
콜 센터 데이터의 탐구 분석을 수행하는 신경망 모델 및 로지스틱 회귀 모델. 예비 모델이 나타내는 정보를 기반으로 하여 콜 센터의 사용자 환경을 개선하기 위한 가능한 전략을 식별하는 모델을 만듭니다.
학습 내용
이 자습서에서는 여러 유형의 데이터 마이닝 알고리즘을 만들고 작업하는 방법에 대해 설명합니다. 이 자습서에서는 다음 개념도 설명합니다.
중첩 테이블을 사용하여 모델 작성
중첩 테이블 키, 시계열 키 또는 시퀀스 키 선택
모델을 만들거나 예측을 수행할 때 중첩 테이블 필터링
모델을 지원할 데이터가 충분한지 판단
일반 모델을 작성하여 여러 데이터 집합에 적용
이 자습서는 다음 단원으로 이루어져 있습니다.
1단원: 중간 데이터 마이닝 솔루션 만들기(중급 데이터 마이닝 자습서)
이 단원에서는 여러 가지 새로운 데이터 원본 뷰 및 기타 여러 마이닝 모델을 지원할 AdventureWorksDW2008R2 데이터베이스를 기반으로 새 프로젝트를 만듭니다.2단원: 예측 시나리오 구축(중급 데이터 마이닝 자습서)
이 단원에서는 예측 시나리오의 일부로 사용할 수 있는 마이닝 모델을 만듭니다. 또한 Microsoft 시계열 알고리즘으로 작성한 마이닝 모델을 탐색합니다.각 지역에 대한 개별 모델과 교차 예측에 사용할 수 있는 일반 모델을 작성합니다.
3단원: 시장 바구니 시나리오 구축(중급 데이터 마이닝 자습서)
이 단원에서는 새 데이터 원본 뷰를 추가한 다음 중첩 테이블과 키 사용 방법에 대해 설명합니다. 이 데이터를 기반으로 시장 바구니 시나리오의 일부로 사용할 수 있는 마이닝 모델을 만듭니다. 또한 Microsoft 연결 알고리즘으로 작성한 마이닝 모델을 탐색합니다.4단원: 시퀀스 클러스터링 시나리오 구축(중급 데이터 마이닝 자습서)
이 단원에서는 시퀀스 클러스터링 시나리오의 일부로 사용할 수 있는 마이닝 모델을 만듭니다. Microsoft 시퀀스 클러스터링 알고리즘으로 구축된 마이닝 모델을 탐색하는 방법도 배웁니다.5단원: 신경망 및 로지스틱 회귀 모델 작성(중급 데이터 마이닝 자습서)
이 단원에서는 Microsoft 신경망 및 Microsoft 로지스틱 회귀 알고리즘을 사용하여 여러 관련된 마이닝 모델을 만듭니다. 또한 데이터 원본 뷰를 사용하여 모델의 기본이 되는 데이터를 탐색하는 방법도 배웁니다.
요구 사항
다음이 설치되어 있어야 합니다.
Microsoft SQL Server 2008 R2
Microsoft SQL Server Analysis Services
AdventureWorksDW2008R2 데이터베이스가 있는 SQL Server
보안을 위해 예제 데이터베이스는 기본적으로 설치되지 않습니다. Microsoft SQL Server의 공식 데이터베이스를 설치하려면 Microsoft SQL Sample Databases 페이지에서 SQL Server 2008R2를 선택합니다.
[!참고]
문서 뷰어 도구 모음에 다음 항목 단추 및 이전 항목 단추를 추가하면 단계의 앞뒤로 편리하게 이동할 수 있어 자습서를 더 쉽게 진행할 수 있습니다. 자세한 내용은 도움말에 다음 및 이전 단추 추가를 참조하십시오.