4단원: Bike Buyer 마이닝 모델 찾아보기
새 설치: 2005년 12월 5일
이 단원에서는 SELECT(DMX) 문을 사용하여 2단원: Bike Buyer 마이닝 구조에 마이닝 모델 추가에서 만든 의사결정 트리 및 클러스터링 마이닝 모델의 내용을 탐색합니다.
마이닝 모델에 포함된 열은 마이닝 구조에서 정의한 열이 아니라 알고리즘에서 찾은 경향 및 패턴을 설명하는 특정 열 집합입니다. 이러한 마이닝 모델 열은 DMSCHEMA_MINING_MODEL_CONTENT Rowset 스키마 행 집합에 설명되어 있습니다. 예를 들어 내용 스키마 행 집합의 MODEL_NAME 열에는 마이닝 모델의 이름이 포함되어 있습니다. 클러스터링 마이닝 모델의 경우 NODE_CAPTION 열에는 각 클러스터의 이름이 포함되어 있으며 NODE_DESCRIPTION 열에는 각 클러스터의 특징에 대한 설명이 포함되어 있습니다. DMX에서 SELECT FROM <model>.CONTENT 문을 사용하여 이러한 열을 찾아볼 수 있습니다. 이 문을 사용하여 마이닝 모델 생성에 사용된 데이터도 탐색할 수 있습니다. 이 문을 사용하려면 마이닝 구조에 드릴스루를 설정해야 합니다. 이 문에 대한 자세한 내용은 SELECT FROM <model>.CASES(DMX)를 참조하십시오.
또한 SELECT DISTINCT 문을 사용하여 불연속 열의 모든 상태를 반환할 수 있습니다. 예를 들어 Gender 열에서 이 작업을 수행하면 쿼리는 male 및 female을 반환합니다.
단원 작업
이 단원에서는 다음 작업을 수행합니다.
- 마이닝 모델 내에 포함된 내용 탐색
- 마이닝 모델의 성향 습득에 사용된 원본 데이터에서 사례 반환
- 특정 불연속 열에 가능한 다양한 상태 탐색
마이닝 모델의 내용 반환
이 단원에서는 SELECT FROM <model>.CONTENT(DMX) 문을 사용하여 클러스터링 모델의 내용을 반환합니다.
다음은 SELECT FROM <model>.CONTENT 문의 일반적인 예입니다.
SELECT <select list> FROM [<mining model>].CONTENT
WHERE <where clause>
코드의 첫 번째 줄에서는 마이닝 모델 내용에서 반환할 열과 이 열이 연결된 마이닝 모델을 정의합니다.
SELECT <select list> FROM [<mining model].CONTENT
마이닝 모델 이름 옆에 있는 .CONTENT 절은 해당 마이닝 모델에서 내용을 반환함을 지정합니다. 마이닝 모델 내에 포함된 열에 대한 자세한 내용은 DMSCHEMA_MINING_MODEL_CONTENT Rowset을 참조하십시오.
필요에 따라 코드의 마지막 줄을 사용하여 문에서 반환한 결과를 필터링할 수 있습니다.
WHERE <where clause>
예를 들어 쿼리 결과를 사례 수가 많은 클러스터만으로 제한하려는 경우 SELECT 문에 다음 WHERE 절을 추가합니다.
WHERE NODE_SUPPORT > 100
WHERE 문 사용 방법은 SELECT(DMX)를 참조하십시오.
클러스터링 마이닝 모델의 내용을 반환하려면
개체 탐색기에서 Analysis Services 인스턴스를 마우스 오른쪽 단추로 클릭하고 새 쿼리를 가리킨 다음 DMX를 클릭합니다.
비어 있는 새 쿼리가 포함된 쿼리 편집기가 열립니다.
SELECT FROM <model>.CONTENT 문의 일반적인 예를 빈 쿼리에 복사합니다.
다음 내용을
<select list>
다음 구문으로 바꿉니다.
*를 DMSCHEMA_MINING_MODEL_CONTENT 행 집합 내에 있는 임의의 열 목록으로 바꿀 수도 있습니다.
다음 내용을
[<mining model>]
다음 구문으로 바꿉니다.
[Clustering]
이제 전체 문이 다음과 같아야 합니다.
SELECT * FROM [Clustering].CONTENT
파일 메뉴에서 다른 이름으로 DMXQuery1.dmx 저장을 클릭합니다.
다른 이름으로 저장 대화 상자에서 해당 폴더로 이동한 다음 파일 이름을 SELECT_CONTENT.dmx로 지정합니다.
도구 모음에서 실행 단추를 클릭합니다.
쿼리에서 마이닝 모델의 내용이 반환됩니다.
드릴스루 사용
다음 단계는 드릴스루 문을 사용하여 의사결정 트리 마이닝 모델의 성향 습득에 사용된 사례의 샘플링을 반환하는 것입니다. 이 단원에서는 SELECT FROM <model>.CASES(DMX) 문을 사용하여 의사결정 트리 모델의 내용을 반환합니다.
다음은 SELECT FROM <model>.CASES 문의 일반적인 예입니다.
SELECT <select list>
FROM [<mining model>].CASES
WHERE IsInNode('<node id>')
코드의 첫 번째 줄에서는 원본 데이터에서 반환할 열과 이 열이 포함된 마이닝 모델을 정의합니다.
SELECT <select list> FROM [<mining model>].CASES
.CASES 절은 드릴스루 쿼리를 수행함을 지정합니다. 드릴스루를 사용하려면 마이닝 구조를 만들 때 드릴스루를 설정해야 합니다.
코드의 마지막 줄은 선택 사항이며 사례를 요청할 마이닝 모델의 노드를 지정합니다.
WHERE IsInNode('<node id>')
IsInNode가 있는 WHERE 문 사용 방법은 SELECT FROM <model>.CASES(DMX)를 참조하십시오.
마이닝 모델의 성향 습득에 사용된 사례를 반환하려면
개체 탐색기에서 Analysis Services 인스턴스를 마우스 오른쪽 단추로 클릭하고 새 쿼리를 가리킨 다음 DMX를 클릭합니다.
비어 있는 새 쿼리가 포함된 쿼리 편집기가 열립니다.
SELECT FROM <model>.CASES 문의 일반적인 예를 빈 쿼리에 복사합니다.
다음 내용을
<select list>
다음 구문으로 바꿉니다.
*를 [Bike Buyer]와 같은 원본 데이터 내에 있는 임의의 열 목록으로 바꿀 수도 있습니다.
다음 내용을
[<mining model>]
다음 구문으로 바꿉니다.
[Decision Tree]
이제 전체 문이 다음과 같아야 합니다.
SELECT * FROM [Decision Tree].CASES
파일 메뉴에서 다른 이름으로 DMXQuery1.dmx 저장을 클릭합니다.
다른 이름으로 저장 대화 상자에서 해당 폴더로 이동한 다음 파일 이름을 SELECT_DRILLTHROUGH.dmx로 지정합니다.
도구 모음에서 실행 단추를 클릭합니다.
쿼리에서 의사결정 트리 마이닝 모델의 성향 습득에 사용된 원본 데이터가 반환됩니다.
불연속 마이닝 모델 열의 상태 반환
다음 단계는 SELECT DISTINCT 문을 사용하여 지정된 마이닝 모델 열에 가능한 다양한 상태를 반환하는 것입니다.
다음은 SELECT DISTINCT 문의 일반적인 예입니다.
SELECT DISTINCT [<column>]
FROM [<mining model>]
코드의 첫 번째 줄에서는 상태가 반환된 마이닝 모델 열을 정의합니다.
SELECT DISTINCT [<column>]
열의 모든 상태를 반환하려면 DISTINCT를 포함해야 합니다. DISTINCT를 제외하면 전체 문이 예측의 바로 가기가 되며 지정된 열이 있을 가능성이 가장 높은 상태를 반환합니다. 자세한 내용은 SELECT(DMX)를 참조하십시오.
불연속 열의 상태를 반환하려면
개체 탐색기에서 Analysis Services 인스턴스를 마우스 오른쪽 단추로 클릭하고 새 쿼리를 가리킨 다음 DMX를 클릭합니다.
비어 있는 새 쿼리가 포함된 쿼리 편집기가 열립니다.
SELECT Distinct 문의 일반적인 예를 빈 쿼리에 복사합니다.
다음 내용을
[<column,name>
다음 구문으로 바꿉니다.
[Bike Buyer]
다음 내용을
[<mining model>]
다음 구문으로 바꿉니다.
[Decision Tree]
이제 전체 문이 다음과 같아야 합니다.
SELECT DISTINCT [Bike Buyer] FROM [Decision Tree]
파일 메뉴에서 다른 이름으로 DMXQuery1.dmx 저장을 클릭합니다.
다른 이름으로 저장 대화 상자에서 해당 폴더로 이동한 다음 파일 이름을 SELECT_DISCRETE.dmx로 지정합니다.
도구 모음에서 실행 단추를 클릭합니다.
쿼리에서 Bike Buyer 열의 가능한 상태가 반환됩니다.
다음 단원에서는 의사결정 트리 마이닝 모델을 사용하여 잠재 고객이 자전거 구매자가 될 것인지 여부를 예측합니다.