예외 강조 표시(Excel용 테이블 분석 도구)
경우에 따라 데이터에 특이한 값이 포함될 수 있습니다. 주택 소유자의 나이가 5세로 나타나는 것이 이러한 예입니다. 이상값이라고도 하는 이러한 값 은 데이터 입력 오류로 인해 잘못되거나 비정상적인 추세를 나타낼 수 있습니다. 어느 쪽이든 이러한 예외는 분석 품질에 영향을 미칩니다. 예외 강조 표시 도구를 사용하면 이러한 값을 찾고 추가 작업을 검토할 수 있습니다.
예외 강조 표시 도구는 Excel 데이터 테이블의 전체 데이터 범위에서 작동하거나 몇 개의 열만 선택할 수 있습니다. 또한 데이터의 변동성을 제어하는 임계값을 조정하여 예외 범위를 넓히거나 좁힐 수 있습니다.
도구가 분석을 완료하면 분석한 각 열에 몇 개의 이상값이 있는지에 대한 요약 보고서가 포함된 새 워크시트가 만들어지며 원래 데이터 테이블의 예외도 강조 표시됩니다. 이 도구는 전체적인 추세를 분석하므로 한 행에 있는 대부분의 값이 정상임을 확인하고 해당 행에서 하나의 셀만 강조 표시할 수 있습니다. 위의 주택 소유자 예제에서는 Age 열만 강조 표시될 수 있습니다.
요약 보고서에서예외 임계값을 변경할 수도 있습니다. 이 값은 특정 셀에 비정상적인 값이 포함될 확률을 나타냅니다. 따라서 값을 늘리면 더 적은 값이 이상값으로 강조 표시됩니다. 반대로 값을 낮추면 강조 표시되는 셀이 증가하게 됩니다.
예외 강조 표시 도구 사용
Excel 테이블을 열고 예외 강조 표시를 클릭합니다.
분석할 열을 지정합니다.
실행을 클릭합니다.
테이블 이름> 이상값이라는 워크<시트를 열어 발견된 이상값에 대한 요약을 봅니다.
강조 표시 수를 변경하려면 예외 강조 보고서의예외 임계값 행에서 위쪽 및 아래쪽 화살표를 클릭합니다.
요구 사항
다른 행을 예측하는 데 유용한 정보가 있는 열 값의 경우 잘못된 값이 포함되지 않았다면 해당 열을 포함할 수 있습니다. 그러나 누락된 값이 많거나 0 값이 많은 열은 선택 취소해야 합니다.
선택한 모든 열은 일반 패턴을 만드는 데 사용되므로 다음과 같이 정보가 부족한 입력 열을 사용해서는 안 됩니다.
ID와 같은 고유한 값이 들어 있는 열
잘못된 값이 들어 있을 가능성이 높은 열
누락된 값이 많은 열
누락된 값이 많은 입력 열을 포함하는 것이 유용한 경우도 있습니다. 예를 들어 고객이 소매업체를 통해 구매할 때 주소 필드의 값이 항상 누락된 경우 데이터 마이닝 알고리즘은 이 정보를 사용하여 다른 유사한 고객을 식별할 수 있습니다. 누락으로 인해 데이터가 누락되었는지 또는 누락 상태가 의미 있기 때문에 대/소문자별로 결정해야 합니다.
패턴을 만드는 데 유용하게 사용될 가능성이 낮은 열. 예를 들어 모든 행의 값이 같은 열은 패턴을 작성하는 데 유용한 정보를 제공하지 못합니다.
예외 강조 표시 보고서 이해
실행을 클릭하면 도구에서 다음 세 가지 작업을 수행합니다.
테이블의 현재 데이터를 기반으로 데이터 마이닝 구조를 만듭니다.
Microsoft 클러스터링 알고리즘을 사용하여 새 데이터 마이닝 모델을 만듭니다.
패턴을 기반으로 워크시트에 비정상적인 값이 있는지 확인하는 예측 쿼리를 만듭니다.
예외 임계값의 초기 값은 항상 75이며 이는 계산된 알고리즘에서 강조 표시된 데이터가 잘못될 확률이 75%임을 의미합니다. 이 값은 초기 분석 시도를 위해 도구에서 자동으로 설정되지만 사용자가 보고서에서 이 값을 변경할 수 있습니다.
예외 강조 표시 도구는 의심스러운 원래 데이터 테이블의 셀을 강조 표시합니다. 어두운 강조 표시는 해당 행을 주의해야 함을 의미합니다. 밝은 강조 표시는 특정 셀의 값이 의심스러운 항목으로 식별되었음을 의미합니다. 예외 임계값을 변경하면 강조 표시된 값도 그에 맞게 변경됩니다.
요약 차트에서는 각 열에서 임계값을 초과하는 셀의 수를 보여 줍니다.
관련 도구
데이터 마이닝을 위한 준비 과정에 데이터를 정리 또는 검토할 때 Excel용 데이터 마이닝 클라이언트의 데이터 탐색 기능을 사용할 수 있습니다. 이 추가 기능은 이상값 검색, 데이터 레이블 재지정 또는 데이터 분포 확인을 지원하는 여러 고급 도구를 제공합니다. Excel용 데이터 마이닝 클라이언트의 데이터 탐색 도구에 대한 자세한 내용은 데이터 탐색 및 정리를 참조하세요.
예외 강조 표시 도구는 Microsoft 클러스터링 알고리즘을 사용합니다. 클러스터링 모델은 비슷한 특성을 공유하는 행 그룹을 검색합니다. Excel용 데이터 마이닝 클라이언트는 그래프 및 특성 프로필을 사용하여 클러스터링 만든 데이터 마이닝 모델을 탐색할 수 있는 찾아보기 창을 제공합니다. 예외 강조 표시 도구에서 만든 클러스터링 모델을 찾아보는 방법에 대한 자세한 내용은 모델 찾아보기(Excel용 데이터 마이닝 클라이언트)를 참조하세요.
Microsoft 클러스터링 알고리즘에 대한 자세한 내용은 SQL Server 온라인 설명서의 "Microsoft 클러스터링 알고리즘" 항목을 참조하세요.