데이터 마이닝 마법사
Microsoft SQL Server 2005 Analysis Services(SSAS)의 데이터 마이닝 마법사는 새 마이닝 구조를 데이터 마이닝 프로젝트에 추가할 때마다 시작됩니다. 이 마법사는 새 구조를 정의하고 각 구조에 대한 초기 마이닝 모델도 정의합니다. 테이블 및 열을 포함한 초기 모델의 구조는 기존 데이터 원본 뷰 또는 큐브에서 파생됩니다.
데이터 마이닝 마법사를 사용하여 다음 작업을 완료할 수 있습니다.
- 관계형 데이터베이스 또는 OLAP 데이터베이스의 기존 큐브에서 데이터 마이닝 구조 및 모델을 작성할지 여부를 지정합니다.
- 초기 모델을 작성할 때 사용할 알고리즘을 지정합니다.
- 모델을 작성할 성향 습득 데이터를 포함하는 데이터 원본 뷰 또는 큐브 차원을 지정합니다.
- 관계형 데이터 원본에서 사례 테이블 및 중첩 테이블을 지정하여 사례 집합을 정의하거나 OLAP 데이터 원본에서 사례 키 및 사례 수준 열을 정의합니다.
- 사례 집합의 열에 대한 사용법을 정의합니다.
- 열 내용 및 데이터 형식을 자동 검색 및 설정합니다.
- 마이닝 모델이 OLAP 데이터 원본을 기반으로 하는 경우 큐브를 조각화합니다.
- 새 마이닝 구조 및 초기 마이닝 모델의 이름을 지정합니다.
- 마이닝 모델이 OLAP 데이터 원본을 기반으로 하는 경우 새 데이터 마이닝 차원을 만듭니다.
데이터 마이닝 마법사를 완료한 다음에는 데이터 마이닝 디자이너를 사용하여 마이닝 구조 및 모델을 수정하며 모델을 찾아보고 모델을 기반으로 예측할 수 있습니다.
참조 항목:데이터 마이닝 디자이너
데이터 마이닝 마법사 사용
데이터 마이닝 마법사를 시작하려면 Business Intelligence Development Studio의 프로젝트 메뉴 또는 솔루션 탐색기를 사용하여 새 마이닝 구조를 Analysis Services 프로젝트에 추가합니다.
데이터 마이닝 마법사는 데이터 원본의 유형에 따라 다음과 같은 두 부분으로 나뉩니다.
- 관계형 마이닝 모델
- OLAP 마이닝 모델
관계형 마이닝 모델
Analysis Services의 관계형 데이터 원본에서 마이닝 모델을 작성하는 경우에는 먼저 데이터 마이닝 마법사에서 기존 관계형 데이터베이스를 사용하여 모델 구조를 정의하도록 지정합니다. 다음으로 원하는 데이터 마이닝 분석 유형에 가장 적합한 알고리즘을 선택하여 사용할 데이터 마이닝 기술을 지정합니다.
참조 항목:데이터 마이닝 알고리즘
데이터 원본 뷰 및 테이블 유형 지정
마법사의 다음 단계는 마이닝 구조를 정의하는 데 사용할 특정 데이터 원본 뷰를 선택하고 사례 테이블을 지정하는 것입니다. 사례 테이블은 마이닝 모델의 성향을 습득하는 데 사용할 성향 습득 데이터를 포함합니다. 데이터가 여러 테이블에 포함된 경우 테이블이 사례 테이블 내에서 중첩되도록 지정할 수도 있습니다.
참조 항목:중첩 테이블
열 사용법 지정
사례 테이블 및 중첩 테이블을 지정한 다음에는 마이닝 구조에 포함시킬 테이블의 각 열에 대한 사용 유형을 결정합니다. 열에 대한 사용 유형을 지정하지 않으면 해당 열이 마이닝 구조에 포함되지 않습니다. 데이터 마이닝 열의 유형은 키, 입력, 예측 가능 중 하나이거나 입력과 예측 가능의 조합일 수 있습니다. 키 열은 테이블의 각 행에 대한 고유 식별자를 포함합니다. 시퀀스 클러스터링 및 시계열 모델과 같은 일부 마이닝 모델은 여러 키 열을 포함할 수 있습니다. 입력 열은 예측의 기반이 되는 정보를 제공합니다. 예측 가능한 열은 마이닝 모델에서 예측하려는 정보를 포함합니다.
예를 들어 일련의 테이블에 고객 ID, 인구 통계 정보 및 특정 매장에서 각 고객이 소비하는 금액이 포함될 수 있습니다. 고객 ID는 고객을 고유하게 식별하고 사례 테이블을 중첩 테이블과 연결하므로 키 열로 사용될 수 있습니다. 인구 통계 정보의 열 일부는 입력 열로, 각 고객이 소비하는 금액을 설명하는 열은 예측 가능한 열로 사용될 수 있습니다. 그런 다음 인구 통계 정보와 특정 고객이 특정 매장에서 소비하는 금액을 연결하는 마이닝 모델을 작성할 수 있습니다. 이 모델을 대상 마케팅의 기본으로 사용할 수 있습니다.
데이터 마이닝 마법사에서는 예측 가능한 열을 선택하면 설정되는 제안 기능을 사용할 수 있습니다. 데이터 집합은 마이닝 모델을 작성하는 데 사용하려는 것보다 더 많은 열을 포함하는 경우가 많습니다. 제안 기능은 데이터 집합의 각 열과 예측 가능한 열 사이의 관계를 설명하는 0에서 1 사이의 점수를 계산합니다. 제안 기능은 이 점수를 기준으로 마이닝 모델에 대한 입력으로 사용할 열을 제안합니다. 제안 기능을 사용하는 경우 제안된 열을 사용하거나, 필요에 맞게 선택 사항을 수정하거나, 제안을 무시할 수 있습니다.
내용 및 데이터 형식 지정
하나 이상의 예측 가능한 열과 입력 열을 선택한 다음에는 각 열에 대한 내용과 데이터 형식을 지정할 수 있습니다.
참조 항목:데이터 형식(데이터 마이닝), 내용 유형(데이터 마이닝)
마법사 완료
마법사의 마지막 단계는 마이닝 구조 및 관련 마이닝 모델의 이름을 지정하는 것입니다. 드릴스루 허용을 선택한 경우 드릴스루 기능이 모델에 설정되며 이 기능을 사용하여 모델을 작성하는 데 사용되는 원본 데이터를 탐색할 수 있습니다.
맨 위로 이동
OLAP 마이닝 모델
Analysis Services의 OLAP 데이터 원본에서 다차원 마이닝 모델을 작성하는 경우에는 먼저 데이터 마이닝 마법사에서 기존 큐브를 사용하여 모델 구조를 정의하도록 지정합니다. 다음으로 원하는 데이터 마이닝 분석 유형에 가장 적합한 알고리즘을 선택하여 사용할 데이터 마이닝 기술을 지정합니다.
참조 항목:데이터 마이닝 알고리즘
데이터 원본 및 사례 키 지정
다음으로 마이닝 구조를 정의하기 위해 데이터 원본으로 사용할 큐브 차원을 선택합니다. 그런 다음 마이닝 모델의 키(사례 키)로 사용할 특성을 선택합니다.
[!참고] 작성 중인 OLAP 마이닝 모델 및 모델 생성에 사용하는 원본 큐브는 동일한 Analysis Services 데이터베이스에 있어야 합니다.
사례 수준 열 및 열 사용법 지정
사례 키를 선택하면 해당 키와 연결된 특성 및 측정값이 마법사의 다음 페이지에서 트리 뷰에 표시됩니다. 이 목록에서 구조의 열로 사용할 특성 및 측정값을 선택합니다. 이러한 열을 사례 수준 열이라고 합니다. 관계형 모델과 마찬가지로 각 열이 구조에서 사용되는 방법을 지정해야 하며 이는 마법사의 다음 페이지에서 수행할 수 있습니다. 열은 키, 입력, 예측 가능, 입력과 예측 가능의 조합 중 하나이거나 아무 것도 선택하지 않을 수 있습니다.
중첩 테이블 추가
데이터 마이닝 마법사에서 OLAP 마이닝 모델을 작성하는 경우에는 마이닝 모델 구조에 중첩 테이블을 추가할 수 있습니다. 마법사의 마이닝 모델 열 사용법 지정 페이지에서 중첩 테이블 추가를 클릭하여 중첩 테이블을 추가하는 단계를 안내하는 별도의 대화 상자를 엽니다. 이 대화 상자에는 차원에 적용되는 측정값 그룹만 표시됩니다. 사례 차원의 외래 키를 포함하는 측정값 그룹을 선택합니다. 그런 다음 측정값 그룹의 각 열에 대한 사용법을 입력 또는 예측 가능으로 지정합니다. 그러면 마법사에서 중첩 테이블을 사례 테이블에 추가합니다. 중첩 테이블의 기본 이름은 중첩 차원 이름이지만 중첩 테이블 및 해당 열의 이름을 바꿀 수 있습니다. 참조 항목:중첩 테이블
내용 및 데이터 형식 지정
하나 이상의 예측 가능한 열과 입력 열을 선택한 다음에는 각 열에 대한 내용과 데이터 형식을 지정할 수 있습니다.
참조 항목:데이터 형식(데이터 마이닝), 내용 유형(데이터 마이닝)
원본 큐브 조각화
마법사에서 OLAP 마이닝 모델을 작성하는 경우 마이닝 모델의 성향을 습득하기 전에 원본 큐브를 조각화하여 마이닝 모델의 범위를 제한할 수 있습니다. 큐브 조각화는 SQL 문에 WHERE 절을 추가하는 것과 유사합니다. 예를 들어 큐브에 제품 구매 정보가 있는 경우 연령 특성을 30세 이상으로, 성별 열을 여성만으로, 구매일을 2000년 3월 이후로 제한하여 모델에서 2000년 3월 이후에 제품을 구매한 30세 이상의 여성이라는 범위만 포함하도록 제한할 수 있습니다.
마법사 완료
마법사의 마지막 단계는 마이닝 구조 및 관련 마이닝 모델의 이름을 지정하는 것입니다. 드릴스루 허용을 선택한 경우 드릴스루 기능이 모델에 설정되며 이 기능을 사용하여 모델을 작성하는 데 사용되는 원본 데이터를 탐색할 수 있습니다. 또한 마이닝 모델에 기반하여 새 차원을 원본 큐브에 추가할지, 아니면 마이닝 모델에서 새 큐브를 만들지 여부를 지정할 수 있습니다.
맨 위로 이동
참고 항목
개념
새 마이닝 구조 만들기
데이터 마이닝 디자이너의 마이닝 모델 관리
데이터 마이닝 개념
데이터 마이닝 도구 사용
데이터 마이닝 작업