다음을 통해 공유


Market Basket DMX 자습서

이 자습서에서는 DMX(Data Mining Extensions) 쿼리 언어를 사용하여 마이닝 모델을 만들고 학습하며 탐색하는 방법을 설명합니다. 그런 다음 이러한 마이닝 모델을 사용하여 동시에 구매하는 경향이 있는 제품을 설명하는 예측을 만듭니다.

마이닝 모델은 가상 회사 Adventure Works Cycles에 대한 데이터를 저장하는 AdventureWorksDW2012 샘플 데이터베이스에 포함된 데이터에서 만들어집니다. Adventure Works Cycles는 다국적 대형 제조 회사입니다. 이 회사는 금속 및 복합 자전거를 제조하고 판매하여 북아메리카n, 유럽 및 아시아 상업 시장에 판매합니다. 기본 운영은 290명의 직원이 있는 워싱턴 주 보텔에 위치하고 있으며, 여러 지역 영업 팀이 국제 시장 기반에 위치하고 있습니다.

자습서 시나리오

Adventure Works Cycles는 데이터 마이닝 기능을 사용하여 고객이 동시에 구매하는 경향이 있는 제품 유형을 예측하는 사용자 지정 애플리케이션을 만들기로 결정했습니다. 사용자 지정 애플리케이션의 목표는 제품 집합을 지정하고 지정된 제품으로 구매할 추가 제품을 예측할 수 있도록 하는 것입니다. 그런 다음 Adventure Works Cycles는 이 정보를 사용하여 웹 사이트에 "제안" 기능을 추가하고 고객에게 정보를 제공하는 방법을 더 잘 구성합니다.

Microsoft SQL Server Analysis Services는 이 작업을 수행하는 데 사용할 수 있는 몇 가지 도구를 제공합니다.

DMX(데이터 마이닝 확장)는 마이닝 모델을 만들고 작업하는 데 사용할 수 있는 Analysis Services에서 제공하는 쿼리 언어입니다. Microsoft Association 알고리즘은 함께 구매할 가능성이 있는 제품을 예측할 수 있는 모델을 만듭니다.

이 자습서의 목표는 사용자 지정 애플리케이션에서 사용할 DMX 쿼리를 제공하는 것입니다.

자세한 내용은 데이터 마이닝 솔루션

마이닝 구조 및 마이닝 모델

DMX 문을 만들기 전에 Analysis Services에서 마이닝 모델을 만드는 데 사용하는 주요 개체를 이해하는 것이 중요합니다. 마이닝 구조는 마이닝 모델이 빌드되는 데이터 도메인을 정의하는 데이터 구조입니다. 단일 마이닝 구조에는 동일한 도메인을 공유하는 여러 마이닝 모델이 포함될 수 있습니다. 마이닝 모델은 마이닝 구조로 나타나는 데이터에 마이닝 모델 알고리즘을 적용합니다.

마이닝 구조의 구성 요소는 데이터 원본에 포함된 데이터를 설명하는 마이닝 구조 열입니다. 이러한 열에는 데이터 형식, 내용 유형, 데이터 배포 방법 등의 정보가 포함됩니다.

마이닝 모델에는 마이닝 구조에 설명된 키 열뿐만 아니라 나머지 열의 하위 집합도 포함되어야 합니다. 마이닝 모델은 각 열에 대한 사용을 정의하고 마이닝 모델을 만드는 데 사용되는 알고리즘을 정의합니다. 예를 들어 DMX에서 열이 키 열 또는 PREDICT 열임을 지정할 수 있습니다. 열을 지정하지 않으면 Input 열로 간주됩니다.

DMX에는 마이닝 모델을 만드는 두 가지 방법이 있습니다. 문을 사용하여 CREATE MINING MODEL 마이닝 구조와 관련 마이닝 모델을 함께 만들거나, 먼저 문을 사용하여 CREATE MINING STRUCTURE 마이닝 구조를 만든 다음 문을 사용하여 ALTER STRUCTURE 구조에 마이닝 모델을 추가할 수 있습니다. 이러한 방법은 아래에서 설명합니다.

CREATE MINING MODEL
이 문을 사용하여 동일한 이름을 사용하여 마이닝 구조 및 관련 마이닝 모델을 함께 만듭니다. 마이닝 모델 이름에는 마이닝 구조와 구분하기 위해 "Structure"가 추가됩니다.

이 문은 단일 마이닝 모델을 포함하는 마이닝 구조를 만드는 경우에 유용합니다.

자세한 내용은 DMX(CREATE MINING MODEL)를 참조하세요.

마이닝 구조 만들기
이 문을 사용하여 모델 없이 새 마이닝 구조를 만듭니다.

CREATE MINING STRUCTURE를 사용하는 경우 같은 마이닝 구조를 기반으로 한 모델을 테스트하는 데 사용할 수 있는 홀드아웃 데이터 집합을 만들 수도 있습니다.

자세한 내용은 DMX(CREATE MINING STRUCTURE)를 참조하세요.

ALTER MINING STRUCTURE
이 문을 사용하여 서버에 이미 있는 마이닝 구조에 마이닝 모델을 추가합니다.

단일 마이닝 구조에 마이닝 모델을 두 개 이상 추가하는 이유에는 여러 가지가 있습니다. 예를 들어 여러 알고리즘을 사용하여 몇 가지 마이닝 모델을 만들어 가장 적합한 마이닝 모델을 확인할 수 있습니다. 또는 동일한 알고리즘을 사용하여 여러 마이닝 모델을 만들 수 있지만 각 마이닝 모델에 대해 다르게 설정된 매개 변수를 사용하여 해당 매개 변수에 가장 적합한 설정을 찾을 수 있습니다.

자세한 내용은 DMX(ALTER MINING STRUCTURE)를 참조하세요.

여러 마이닝 모델을 포함하는 마이닝 구조를 만들므로 이 자습서의 두 번째 메서드를 사용합니다.

상세 설명

DMX(데이터 마이닝 확장) 참조, DMX Select 문 이해, DMX 예측 쿼리의 구조 및 사용

학습 내용

이 자습서는 다음 단원으로 이루어져 있습니다.

1단원: 시장 바구니 마이닝 구조 만들기
이 단원에서는 문을 사용하여 CREATE 마이닝 구조를 만드는 방법을 알아봅니다.

2단원: 시장 바구니 마이닝 구조에 마이닝 모델 추가
이 단원에서는 문을 사용하여 마이닝 구조에 ALTER 마이닝 모델을 추가하는 방법을 알아봅니다.

3단원: 시장 바구니 마이닝 구조 처리
이 단원에서는 문을 사용하여 INSERT INTO 마이닝 구조 및 관련 마이닝 모델을 처리하는 방법을 알아봅니다.

4단원: 시장 바구니 예측 실행
이 단원에서는 PREDICTION JOIN 문을 사용하여 마이닝 모델에 대한 예측을 만드는 방법에 대해 설명합니다.

요구 사항

이 자습서를 사용하려면 먼저 다음을 설치해야 합니다.

  • Microsoft SQL Server

  • Microsoft SQL Server Analysis Services

  • AdventureWorksDW2012 데이터베이스

보안을 위해 예제 데이터베이스는 기본적으로 설치되지 않습니다. Microsoft SQL Server용 공식 샘플 데이터베이스를 설치하려면 Microsoft SQL Server 제품 샘플 섹션의 Microsoft SQL Server 샘플 및 커뮤니티 프로젝트 홈페이지로 이동하거나 Microsoft SQL Server 제품 샘플로 이동 https://www.CodePlex.com/MSFTDBProdSamples 하세요. Databases, Releases 탭을 차례로 클릭한 다음 원하는 데이터베이스를 선택합니다.

참고 항목

자습서를 검토할 때는 문서 뷰어 도구 모음에 다음 항목 단추 및 이전 항목 단추를 추가하는 것이 좋습니다.

참고 항목

Bike Buyer DMX 자습서
기본 데이터 마이닝 자습서
3단원: 시장 바구니 시나리오 빌드(중간 데이터 마이닝 자습서)