분류 마법사(Excel용 데이터 마이닝 추가 기능)
분류 마법사를 사용하면 Excel 테이블, Excel 범위 또는 외부 데이터 원본의 기존 데이터를 기반으로 분류 모델을 만들 수 있습니다.
분류 모델을 사용하면 유사성을 나타내는 데이터의 패턴을 추출하여 값 그룹에 따라 예측할 수 있습니다. 예를 들어 수입 또는 지출 패턴을 기반으로 위험을 예측하는 데 분류 모델을 사용할 수 있습니다.
분류 마법사 사용
데이터 마이닝 리본에서 분류를 클릭한 다음, 다음을 클릭합니다.
원본 데이터 선택 페이지에서 분석할 데이터를 선택합니다.
이 마법사는 Excel 테이블, Excel 범위 및 외부 데이터 원본과 같은 여러 종류의 데이터를 지원합니다. 외부 데이터의 경우 Excel에 추가하거나 Analysis Services 데이터 원본에서 테이블 또는 뷰 집합을 선택할 수 있습니다. 또한 테이블을 추가하고 열을 변경해서 임시 데이터 원본을 만들 수 있습니다.
분류 페이지에서 분류할 열을 선택합니다.
목록의 열, 입력 열을 검토하고 고유한 값을 가진 열을 선택 취소하므로 ID 번호, 고객 이름 등과 같은 패턴을 만드는 데 유용하지 않습니다. 또한 본질적으로 분류 가능한 열이 중복되게 만드는 열도 제거해야 합니다.
예를 들어 제품 범주 예측을 분류하는 경우, 알려진 비즈니스 규칙이 있으면 하위 범주 필드를 제외해야 합니다. 그렇지 않으면 해당 규칙의 강도로 인해 다른 상관 관계를 검색하는 데 방해가 될 수 있습니다.
필요에 따라 매개 변수를 클릭하여 알고리즘 매개 변수를 변경하고 클러스터링 모델의 동작을 사용자 지정합니다.
학습 및 테스트 집합으로 데이터 분할 페이지에서 테스트를 위해 보유할 데이터의 양을 지정합니다. 나머지는 항상 모델 학습에 사용됩니다.
기본 설정은 테스트 데이터 30%와 학습 데이터 70%입니다.
마침 페이지에서 데이터 집합 및 모델에 대한 설명이 포함된 이름을 제공하고 완성된 모델을 사용하는 방법을 제어하는 다음 옵션을 설정합니다.
모델을 찾아봅니다. 이 옵션을 선택하면 마법사가 모델 처리를 완료하는 즉시 결과를 탐색하는 데 도움이 되는 찾아보기 창이 열립니다. 뷰어 내용은 작성한 모델 유형에 따라 달라집니다. 자세한 내용은 의사 결정 트리 모델 찾아보기 및 신경망 모델 검색을 참조하세요.
드릴스루를 사용하도록 설정합니다. 완료된 모델에서 기본 데이터를 보려면 이 옵션을 선택합니다. 이 옵션은 의사 결정 트리 모델을 작성하는 경우에만 사용할 수 있습니다.
임시 모델 사용. 이 옵션을 선택하면 모델이 서버에 저장되지 않습니다. 임시 모델은 Excel을 닫을 때 삭제됩니다.
분류 모델에 대한 추가 정보
알고리즘 매개 변수 대화 상자에서 Analysis Services에 제공된 이러한 알고리즘 중에서 분류 방법을 선택할 수도 있습니다.
Microsoft 의사 결정 트리
Microsoft 로지스틱 회귀
Microsoft Naïve Bayes
Microsoft 신경망
각 알고리즘이 비슷한 결과를 생성할 수 있지만 데이터의 분석 방법이 다르기 때문에 여러 알고리즘을 시도해보고 결과를 비교하는 것이 좋습니다. 기본 방법은 Microsoft 의사 결정 트리입니다.
매개 변수 목록에서 선택한 알고리즘 유형에 따라 고급 옵션을 변경할 수 있습니다. 각 알고리즘의 매개 변수에 대해서는 SQL Server 온라인 설명서에 보다 자세히 설명되어 있습니다.
Microsoft Naive Bayes 알고리즘 기술 참조
요구 사항
분류 마법사를 사용하려면 Analysis Services 데이터베이스에 연결해야 합니다. 연결을 만드는 방법에 대한 자세한 내용은 원본 데이터에 연결(Excel용 데이터 마이닝 클라이언트)을 참조하세요.