이상값(SQL Server 데이터 마이닝 추가 기능)
메뉴의 이상
이상값은 다음 이유 중 하나에 문제가 있는 데이터 값을 의미합니다.
값이 예상 범위를 벗어납니다.
데이터가 잘못 입력되었습니다.
값이 누락되었습니다.
데이터가 공백 또는 다른 Null 문자열로 구성되어 있습니다.
값은 정확하지만 분포된 범위를 너무 벗어나서 모델에 심각한 영향을 줄 수 있습니다.
Excel용 데이터 마이닝 클라이언트를 사용하여 이러한 데이터를 찾아낸 다음 값을 업데이트하거나 표시하지 않을 수 있습니다. 예를 들어 이상값을 산술 평균값으로 바꾸거나 잠재적으로 잘못된 값이 포함된 행을 삭제할 수 있습니다.
이상값 처리
이상값 제거 마법사는 이상값을 적절하게 처리하는 몇 가지 도구를 제공합니다.
먼저 이상값과 다른 데이터 간의 관계 및 값 분포를 보다 잘 파악하기 위해 데이터를 탐색할 수 있습니다.
예를 들어 데이터 탐색 작업을 사용하여 값을 검토하고 수정할 수 있습니다. 이상값 제거 마법사는 모든 값의 분포를 이해하는 데 도움이 되는 꺾은선형 차트 또는 가로 막대형 차트도 표시합니다.
다음으로 이상값 마법사를 사용하여 이상값 을 제거하거나 변경할 수 있습니다. 사용자가 사용하는 방법은 불연속 값인지 아니면 연속 값인지에 따라 달라집니다.
이 마법사는 불연속 값을 막대형 차트로 표시하는데 각 막대는 데이터의 특정 값을 나타내며 막대의 높이는 각 값에 대한 사례 수를 나타냅니다. 차트의 임계값 컨트롤을 이동하여 극단적이거나 잠재적으로 잘못된 값 그룹을 나타내는 막대를 삭제할 수 있습니다.
이 마법사는 연속 값을 막대형 차트 또는 꺾은선형 차트로 표시합니다. 꺾은선형 차트에서 값은 X축에 표시되며 값의 개수는 Y축에 표시됩니다.
최소값과 최대값을 변경하거나 막대를 슬라이딩하여 차트의 아래쪽 및 하이 엔드에서 값을 제거하거나 유지할지 여부를 제어할 수 있습니다. 최소값 및 최대값 설정을 변경하면 그래프에서 표시되지 않을 데이터가 음영으로 표시됩니다.
처리할 이상값을 선택한 후에는 이러한 이상값을 처리하는 방법을 설정할 수 있습니다. 이상값을 포함하고 있는 행을 삭제하거나 평균, null 또는 다른 선택 사항 값과 같은 대체 값을 지정할 수 있습니다.
끝으로 마법사는 새 데이터를 표시하는 몇 가지 동기화 옵션을 제공합니다. 원래 데이터를 새 값으로 바꾸거나 새 값을 포함하는 테이블에 새 열을 추가하거나 업데이트된 데이터를 포함하는 새 워크시트를 만들 수 있습니다.
이상값 마법사 사용
데이터 마이닝 리본에서 데이터 정리를 클릭하고 이상값을 선택합니다.
원본 데이터 선택 대화 상자에서 Excel 데이터 테이블 또는 셀 범위를 선택하고 다음을 클릭합니다.
경고
Excel에 먼저 복사하지 않으면 외부 데이터에 이상값 마법사를 사용할 수 없습니다.
열 선택 대화 상자에서 단일 열을 선택합니다.
다음을 클릭합니다.
임계값 지정 대화 상자에서 데이터 분포를 검토합니다.
열에 불연속 값이 포함되어 있는 경우 마법사는 각 불연속 값에 대한 개수가 포함된 히스토그램을 표시합니다.
이상값이 드문 값이라고 가정하면 최소 값을 변경하여 필터링할 수 있습니다.
열에 숫자 데이터가 포함된 경우 불연속으로 보기 단추 또는 숫자로 보기 단추를 클릭하여 가로 막대형 차트 또는 꺾은선형 차트의 값 보기 사이를 전환할 수 있습니다.
임계값 지정 대화 상자에서 최소값과 최대값을 입력하거나 슬라이더 막대를 끌어 유지하려는 데이터 범위를 선택합니다. 다음을 클릭합니다.
이상값 처리 대화 상자에서 값을 삭제할지 바꿀지 여부를 지정하고 다음을 클릭합니다.
대상 선택 대화 상자에서 새 데이터를 저장할 위치를 지정합니다.
관련 옵션
마법사는 다음과 같은 옵션을 제공합니다.
옵션 | 설명 |
---|---|
열 선택 | 한 번에 하나의 열만 사용할 수 있습니다. |
임계값 처리 지정 | 최소를 사용하여 임계값을 설정하여 임계값보다 적은 행에 있는 값을 제외합니다. 처음에 Minimum 의 값은 행이 가장 적은 값과 같으며 최소값을 해당 값보다 낮게 만들 수 없습니다. |
이상값 처리 | 이상값을 삭제하려는 경우 현재 워크시트에서 데이터를 변경하거나 새 워크시트에서 데이터의 복사본을 만들 수 있습니다. |