Bike Buyer DMX 자습서
이 자습서에서는 DMX(데이터 마이닝 확장) 쿼리 언어를 사용하여 마이닝 모델을 만들고 학습시키고 탐색하는 방법을 알아봅니다. 그런 다음 이러한 마이닝 모델을 사용하여 고객이 자전거를 구매할지 여부를 결정하는 예측을 만듭니다.
마이닝 모델은 가상 회사 Adventure Works Cycles에 대한 데이터를 저장하는 AdventureWorksDW2012 샘플 데이터베이스에 포함된 데이터에서 만들어집니다. Adventure Works Cycles는 다국적 대형 제조 회사입니다. 이 회사는 금속 및 복합 자전거를 제조하고 판매하여 북아메리카n, 유럽 및 아시아 상업 시장에 판매합니다. 기본 운영은 290명의 직원이 있는 워싱턴 주 보텔에 위치하고 있으며, 국제 시장 기반에 여러 지역 영업 팀이 있습니다.
자습서 시나리오
Adventure Works Cycles는 데이터 마이닝 기능을 사용하는 사용자 지정 애플리케이션을 만들어 데이터 분석을 확장하기로 결정했습니다. 사용자 지정 애플리케이션의 목표는 다음을 수행할 수 있는 것입니다.
잠재 고객에 대한 입력 특정 특성을 사용하여 자전거를 구입할지 여부를 예측합니다.
잠재 고객 목록과 고객에 대한 특성을 입력하고 자전거를 구입할 고객을 예측합니다.
첫 번째 경우 고객 데이터는 고객 등록 페이지에서 제공되며, 두 번째 경우에는 Adventure Works Cycles 마케팅 부서에서 잠재 고객 목록을 제공합니다.
또한 마케팅 부서는 기존 고객을 거주 위치, 자녀 수 및 통근 거리와 같은 특성에 따라 범주로 그룹화할 수 있는 기능을 요청했습니다. 특정 종류의 고객을 대상으로 하는 데 이러한 클러스터를 사용할 수 있는지 여부를 확인하려고 합니다. 이렇게 하려면 추가 마이닝 모델이 필요합니다.
Microsoft SQL Server Analysis Services는 다음 작업을 수행하는 데 사용할 수 있는 몇 가지 도구를 제공합니다.
DMX 쿼리 언어
SQL Server Management Studio의 쿼리 편집기
DMX(데이터 마이닝 확장)는 마이닝 모델을 만들고 작업하는 데 사용할 수 있는 Analysis Services에서 제공하는 쿼리 언어입니다. Microsoft 의사 결정 트리 알고리즘은 누군가가 자전거를 구매할지 여부를 예측하는 데 사용할 수 있는 모델을 만듭니다. 결과 모델은 개별 고객 또는 고객 테이블을 입력으로 사용할 수 있습니다. Microsoft 클러스터링 알고리즘은 공유 특성에 따라 고객 그룹을 만들 수 있습니다. 이 자습서의 목표는 사용자 지정 애플리케이션에서 사용할 DMX 스크립트를 제공하는 것입니다.
자세한 내용은 데이터 마이닝 솔루션
마이닝 구조 및 마이닝 모델
DMX 문을 만들기 전에 Analysis Services에서 마이닝 모델을 만드는 데 사용하는 주요 개체를 이해하는 것이 중요합니다. 마이닝 구조는 마이닝 모델이 생성된 데이터 도메인을 정의하는 데이터 구조입니다. 단일 마이닝 구조에 같은 도메인을 공유하는 여러 개의 마이닝 모델이 포함될 수 있습니다. 마이닝 모델은 마이닝 구조로 나타나는 데이터에 마이닝 모델 알고리즘을 적용합니다.
마이닝 구조의 구성 요소는 데이터 원본에 포함된 데이터를 설명하는 마이닝 구조 열입니다. 이러한 열에는 데이터 형식, 내용 유형, 데이터 배포 방법 등의 정보가 포함됩니다.
마이닝 모델에는 마이닝 구조에 설명된 키 열뿐만 아니라 나머지 열의 하위 집합도 포함되어야 합니다. 마이닝 모델은 각 열에 대한 사용을 정의하고 마이닝 모델을 만드는 데 사용되는 알고리즘을 정의합니다. 예를 들어 DMX에서 열이 키 열 또는 PREDICT 열임을 지정할 수 있습니다. 열을 지정하지 않으면 Input 열로 간주됩니다.
DMX에는 마이닝 모델을 만드는 두 가지 방법이 있습니다. CREATE MINING MODEL 문을 사용하여 마이닝 구조와 관련 마이닝 모델을 함께 만들거나 먼저 CREATE MINING STRUCTURE 문을 사용하여 마이닝 구조를 만든 다음 ALTER STRUCTURE 문을 사용하여 구조에 마이닝 모델을 추가할 수 있습니다. 다음 표에서는 이러한 방법에 대해 설명합니다.
CREATE MINING MODEL
이 문을 사용하여 동일한 이름을 사용하여 마이닝 구조 및 관련 마이닝 모델을 함께 만듭니다. 마이닝 모델 이름에는 마이닝 구조와 구분하기 위해 "Structure"가 추가됩니다. 이 문은 단일 마이닝 모델을 포함하는 마이닝 구조를 만드는 경우에 유용합니다.
자세한 내용은 DMX(CREATE MINING MODEL)를 참조하세요.
ALTER MINING STRUCTURE
이 문을 사용하여 서버에 이미 있는 마이닝 구조에 마이닝 모델을 추가합니다. 이 문은 여러 가지 다른 마이닝 모델을 포함하는 마이닝 구조를 만들려는 경우에 유용합니다. 단일 마이닝 구조에 마이닝 모델을 두 개 이상 추가하는 이유에는 여러 가지가 있습니다. 예를 들어 다른 알고리즘을 사용하여 가장 적합한 알고리즘을 확인하는 여러 마이닝 모델을 만들 수 있습니다. 동일한 알고리즘을 사용하지만 각 마이닝 모델에 대해 다르게 설정된 매개 변수를 사용하여 매개 변수에 가장 적합한 설정을 찾는 여러 마이닝 모델을 만들 수 있습니다.
자세한 내용은 DMX(ALTER MINING STRUCTURE)를 참조하세요.
여러 마이닝 모델을 포함하는 마이닝 구조를 만들므로 이 자습서의 두 번째 메서드를 사용합니다.
상세 설명
DMX(데이터 마이닝 확장) 참조, DMX Select 문 이해, DMX 예측 쿼리의 구조 및 사용
학습 내용
이 자습서는 다음 단원으로 이루어져 있습니다.
1단원: 자전거 구매자 마이닝 구조 만들기
이 단원에서는 문을 사용하여 CREATE
마이닝 구조를 만드는 방법을 알아봅니다.
2단원: 자전거 구매자 마이닝 구조에 마이닝 모델 추가
이 단원에서는 문을 사용하여 마이닝 구조에 ALTER
마이닝 모델을 추가하는 방법을 알아봅니다.
3단원: Bike Buyer 마이닝 구조 처리
이 단원에서는 문을 사용하여 INSERT INTO
마이닝 구조 및 관련 마이닝 모델을 처리하는 방법을 알아봅니다.
4단원: Bike Buyer 마이닝 모델 찾아보기
이 단원에서는 문을 사용하여 SELECT
마이닝 모델의 콘텐츠를 탐색하는 방법을 알아봅니다.
5단원: 예측 쿼리 실행
이 단원에서는 PREDICTION JOIN
문을 사용하여 마이닝 모델에 대한 예측을 만드는 방법에 대해 설명합니다.
요구 사항
이 자습서를 사용하려면 먼저 다음을 설치해야 합니다.
Microsoft SQL Server
Microsoft SQL Server 2005 Analysis Services(SSAS), SQL Server 2008 Analysis Services(SSAS), SQL Server 2014 Analysis Services(SSAS) 또는 SQL Server Analysis Services
AdventureWorksDW2012 데이터베이스입니다. 보안을 위해 예제 데이터베이스는 기본적으로 설치되지 않습니다. Microsoft SQL Server용 공식 샘플 데이터베이스를 설치하려면 Microsoft SQL 샘플 데이터베이스 페이지를 방문하여 설치하려는 데이터베이스를 선택합니다.
참고 항목
자습서를 검토할 때는 문서 뷰어 도구 모음에 다음 항목 단추 및 이전 항목 단추를 추가하는 것이 좋습니다.