주요 영향 요인 분석(Excel용 테이블 분석 도구)
주요 영향 요인 분석 도구를 사용하면 대상 결과가 포함된 열을 선택하고 알고리즘은 결과에 가장 강력한 영향을 미친 요인을 결정합니다.
도구는 각 결과와 관련된 요인을 보고하며 해당 관계의 확률을 그래픽으로 표시하는 새 데이터 테이블을 만듭니다. 다양한 요인과 결과로 테이블을 필터링하여 결과를 더 심층적으로 탐색할 수 있습니다.
또한 가능한 결과 쌍을 선택하고 비교할 수도 있습니다. 예를 들어, 여러 그룹의 소비자를 비교하여 가능한 의사 결정 요소를 파악할 수 있습니다.
주요 영향 요인 분석 도구 사용
Excel 데이터 테이블을 엽니다.
테이블 도구의 분석 리본에서 주요 영향 요인 분석을 클릭합니다.
분석 대상 열을 하나 선택합니다.
필요에 따라 분석에 사용할 열 선택을 클릭합니다. 고급 열 선택 대화 상자에서 관련 데이터를 포함할 가능성이 가장 높은 열을 선택합니다. 성능과 정확성을 향상시키려면 패턴 분석에 중요하지 않은 ID 또는 이름과 같은 열은 선택을 취소합니다. 확인을 클릭하여 고급 열 선택 대화 상자를 닫습니다.
실행을 클릭합니다.
주요 영향 요인 분석 도구는 데이터를 분석하여 최적의 설정을 확인하고 모든 매개 변수를 자동으로 설정합니다.
패턴을 발견하지 못한 경우 마법사는 문제 설명이 포함된 새 워크시트를 만듭니다.
패턴을 발견할 경우 마법사가 해당 패턴을 보여 주는 보고서의 이름은 열>의 주요 영향 요인입니다<. 다음 절차에서 설명하는 대로 보고서를 사용자 지정할 수 있습니다.
사용자 지정 보고서 만들기
주요 영향 요인에 따른 차별 대화 상자의 값 1 및 값 2 드롭다운 목록에서 선택하여 비교할 두 값을 선택합니다. 예를 들어 구매자와 비구매자를 비교할 수 있습니다.
보고서 추가를 클릭합니다.
마법사는 새 워크시트를 만들고 각 주요 요인 비교 쌍에 대한 테이블을 추가합니다.
비교를 마쳤으면 닫기를 클릭합니다.
주요 영향 요인 보고서 이해
데이터 모델을 만든 후 주요 영향 요인 분석 도구는 주요 영향 요인을 탐색하고 비교하는 데 도움이 되는 보고서를 만듭니다.
왼쪽의 보고서는 기본적으로 생성되며 결과 열의 가장 강력한 예측 요인(종속 변수)을 보여 줍니다.
오른쪽의 보고서는 선택 사항이며 두 가지 특정 결과 값을 비교하여 만들 수 있습니다. 이 보고서는 구매자와 비구매자를 비교합니다.
만드는 보고서마다 새 워크시트가 추가됩니다. 테이블을 만든 후 이동할 수 있습니다. 여기에서는 비교를 위해 나란히 배치했습니다.
상대적 영향
첫 번째 보고서의 음영 처리된 막대는 결과에 대한 이 특성의 연관성 강도를 나타냅니다.
막대의 길이는 해당 요인이 결과에 영향을 미칠 확률을 나타냅니다. 즉, 음영 처리된 막대의 길이가 길수록 연관성도 강해집니다.
유사성
두 번째 보고서에서 비교하는 대상 값은 두 열에 나열되며 관련 요인이 신뢰성의 내림차순으로 표시됩니다.
파란색 막대에는 결과에 기여하는 특성인 "아니요"(=구매하지 않음)가 표시됩니다.
빨간색 막대에는 결과에 기여하는 특성인 "예"(=자전거 구매)가 표시됩니다.
음영 처리된 막대의 색은 임의로 지정되므로 Excel에서 테이블 디자인에 대한 옵션을 설정하여 색상을 변경할 수 없습니다.
두 값을 대조하는 보고서에서 두 번째 보고서는 대상 값에 미치는 영향에 따라 주요 영향 요인의 순위를 부여합니다.
모든 차트가 Excel 테이블을 기반으로 하기 때문에 필터링하고 정렬하여 특정 요인 또는 결과에 초점을 맞출 수 있습니다.
주요 영향 요인 분석 도구에 대한 추가 정보
주요 영향 요인 분석 도구가 데이터를 분석하는 경우 다음을 수행합니다.
데이터의 분포에 대한 주요 정보를 저장하는 데이터 구조를 만듭니다.
Microsoft Naive Bayes 알고리즘을 사용하여 모델을 만듭니다.
각 데이터 열과 지정된 결과의 상관 관계를 나타내는 예측 인수를 만듭니다.
각 예측에 대한 신뢰성 점수를 사용하여 목표 결과를 도출하는 데 가장 큰 영향을 주는 요인을 식별합니다.
신뢰성 점수를 기준으로 정렬된 주요 영향 요인을 설명하는 보고서를 만듭니다.
요구 사항
대상 열에 연속 숫자 값이 포함된 경우 도구는 자동으로 숫자 값을 그룹으로 분할합니다. 이러한 그룹화는 특성이 비슷한 사례의 클러스터를 나타냅니다. 그러나 숫자 값은 사용자에게 친숙한 그룹으로 나눌 수 없습니다. 예를 들어 보고서에는 "<12.85701"과 같은 그룹화가 포함될 수 있지만 보고서 사용자는 일반적으로 10-19, 20-29 등과 같은 정수를 사용하는 그룹을 보고 싶어합니다.
숫자 데이터를 다른 방식으로 그룹화하려면 분석을 만들기 전에 지정한 방식으로 데이터를 분할해야 합니다. 예를 들어 Excel용 데이터 마이닝 클라이언트의 레이블 다시 지정 도구를 사용하여 별도의 열에 새 그룹화 레이블을 만든 다음 분석에서 해당 새 열만 사용할 수 있습니다.
관련 도구
데이터 마이닝 리본은 데이터 마이닝 모델을 사용자 지정하는 기능을 포함하여 고급 도구를 제공합니다.
주요 영향 요인 분석 도구를 사용하여 모델을 저장하는 경우 데이터 마이닝 클라이언트를 사용하여 모델을 찾아보고 관계를 자세히 탐색할 수 있습니다. 자세한 내용은 Excel에서 모델 검색(SQL Server 데이터 마이닝 추가 기능)을 참조하세요. Microsoft Office Visio로도 클러스터 또는 종속성 네트워크로 관계를 보여 주는 차트 및 다이어그램을 만들 수 있습니다. 자세한 내용은 Visio 데이터 마이닝 다이어그램 문제 해결(SQL Server 데이터 마이닝 추가 기능)을 참조하세요.
참고
워크시트를 닫거나 Analysis Services 서버 연결을 종료하면 테이블 분석 도구를 사용할 때 만든 모델이 삭제됩니다. 따라서 Analysis Services 서버에 연결되어 있는 동안에만 모델을 찾아볼 수 있습니다. 연결을 종료하거나 워크시트를 닫으면 Visio에서 모델을 렌더링할 수 없습니다.
주요 영향 요인 분석 도구에서 사용하는 알고리즘에 대한 자세한 내용은 온라인 설명서 SQL Server "Microsoft Naïve Bayes 알고리즘"을 참조하세요.