테스트 집합 만들기(데이터 마이닝 마법사)

아티클
06/13/2017

테스트 집합 만들기 페이지를 사용하여 학습에 사용할 데이터 양과 테스트 집합으로 사용하기 위해 예약할 양을 지정할 수 있습니다. 마이닝 구조를 만들 때 데이터를 학습 및 테스트 집합으로 분리하면 나중에 만드는 마이닝 모델의 정확도를 훨씬 쉽게 평가할 수 있습니다.

테스트 데이터 양을 비율로 지정하거나 테스트에 사용되는 사례 수를 제한하는 수를 지정할 수 있습니다. 테스트에 사용할 사례의 최대 수와 비율을 모두 지정하면 두 설정이 모두 사용되어 테스트 데이터 집합에 적은 수의 사례가 포함됩니다. 기본적으로 데이터의 30%는 테스트에 사용되고, 70%는 학습에 사용되며, 최대 테스트 사례 수는 없습니다.

기본적으로 Analysis Services는 분할을 시작하는 데 사용되는 숫자 시드를 생성합니다. 이 시드는 마이닝 구조의 이름을 기반으로 합니다. 마이닝 구조의 이름이 변경된 경우에도 파티션이 동일하게 유지되도록 하려면 마이닝 구조의 HoldoutSeed 속성을 설정하여 초기값을 지정할 수 있습니다. 홀드아웃 시드를 변경하면 구조를 다시 처리해야 합니다.

나중에 테스트 또는 학습 데이터의 양을 변경하려는 경우 속성 창을 사용하여 데이터 마이닝 구조의 속성 및 HoldoutMaxPercent 속성을 수정 HoldoutMaxCases 할 수 있습니다. 그러나 변경 후에는 마이닝 구조 및 연결된 모든 마이닝 모델을 다시 처리해야 합니다. 또한 다음과 같은 제한 사항이 적용됩니다.

데이터 마이닝 구조의 분할은 데이터 마이닝 구조가 SQL Server 2008에 저장된 경우에만 지원됩니다. 이전 버전의 SQL Server Analysis Services는 마이닝 구조에 대한 파티션 정보의 캐싱을 지원하지 않습니다.
마이닝 구조에 시계열 마이닝 모델에 필요한 Key Time 열이 포함된 경우 마이닝 구조를 분할할 수 없습니다.
중첩 테이블에 저장된 값을 예측하려는 경우 데이터를 분할할 수 없습니다.

자세한 내용: 테스트 및 유효성 검사(데이터 마이닝), 관계형 마이닝 구조 만들기, 기본 데이터 마이닝 자습서

옵션

테스트할 데이터의 백분율
위쪽 및 아래쪽 화살표를 클릭하여 학습 집합으로 사용할 데이터의 백분율을 늘리거나 줄이거나 텍스트 상자에 0에서 100 사이의 값을 입력합니다.

테스트 데이터 집합의 최대 사례 수
테스트에 사용할 수 있는 사례 수를 제한하려면 숫자를 입력합니다.

데이터의 실제 사례 수보다 큰 숫자를 지정하면 모든 사례가 사용됩니다.

기본값은 NULL입니다. 즉, 제한이 없습니다.

참고 항목

데이터 마이닝 마법사 F1 도움말(Analysis Services - 데이터 마이닝)
관련 열 제안(데이터 마이닝 마법사)
테이블 유형 지정(데이터 마이닝 마법사)
열 콘텐츠 및 데이터 형식 지정(데이터 마이닝 마법사)

다음을 통해 공유

테스트 집합 만들기(데이터 마이닝 마법사)

옵션

참고 항목

추가 리소스