다음을 통해 공유


테스트 집합 만들기(데이터 마이닝 마법사)

테스트 집합 만들기 페이지를 사용하여 학습에 사용할 데이터 양과 테스트 집합으로 사용하기 위해 예약할 양을 지정할 수 있습니다. 마이닝 구조를 만들 때 데이터를 학습 및 테스트 집합으로 분리하면 나중에 만드는 마이닝 모델의 정확도를 훨씬 쉽게 평가할 수 있습니다.

테스트 데이터 양을 비율로 지정하거나 테스트에 사용되는 사례 수를 제한하는 수를 지정할 수 있습니다. 테스트에 사용할 사례의 최대 수와 비율을 모두 지정하면 두 설정이 모두 사용되어 테스트 데이터 집합에 적은 수의 사례가 포함됩니다. 기본적으로 데이터의 30%는 테스트에 사용되고, 70%는 학습에 사용되며, 최대 테스트 사례 수는 없습니다.

기본적으로 Analysis Services는 분할을 시작하는 데 사용되는 숫자 시드를 생성합니다. 이 시드는 마이닝 구조의 이름을 기반으로 합니다. 마이닝 구조의 이름이 변경된 경우에도 파티션이 동일하게 유지되도록 하려면 마이닝 구조의 HoldoutSeed 속성을 설정하여 초기값을 지정할 수 있습니다. 홀드아웃 시드를 변경하면 구조를 다시 처리해야 합니다.

나중에 테스트 또는 학습 데이터의 양을 변경하려는 경우 속성 창을 사용하여 데이터 마이닝 구조의 속성 및 HoldoutMaxPercent 속성을 수정 HoldoutMaxCases 할 수 있습니다. 그러나 변경 후에는 마이닝 구조 및 연결된 모든 마이닝 모델을 다시 처리해야 합니다. 또한 다음과 같은 제한 사항이 적용됩니다.

  • 데이터 마이닝 구조의 분할은 데이터 마이닝 구조가 SQL Server 2008에 저장된 경우에만 지원됩니다. 이전 버전의 SQL Server Analysis Services는 마이닝 구조에 대한 파티션 정보의 캐싱을 지원하지 않습니다.

  • 마이닝 구조에 시계열 마이닝 모델에 필요한 Key Time 열이 포함된 경우 마이닝 구조를 분할할 수 없습니다.

  • 중첩 테이블에 저장된 값을 예측하려는 경우 데이터를 분할할 수 없습니다.

자세한 내용: 테스트 및 유효성 검사(데이터 마이닝), 관계형 마이닝 구조 만들기, 기본 데이터 마이닝 자습서

옵션

테스트할 데이터의 백분율
위쪽 및 아래쪽 화살표를 클릭하여 학습 집합으로 사용할 데이터의 백분율을 늘리거나 줄이거나 텍스트 상자에 0에서 100 사이의 값을 입력합니다.

테스트 데이터 집합의 최대 사례 수
테스트에 사용할 수 있는 사례 수를 제한하려면 숫자를 입력합니다.

데이터의 실제 사례 수보다 큰 숫자를 지정하면 모든 사례가 사용됩니다.

기본값은 NULL입니다. 즉, 제한이 없습니다.

참고 항목

데이터 마이닝 마법사 F1 도움말(Analysis Services - 데이터 마이닝)
관련 열 제안(데이터 마이닝 마법사)
테이블 유형 지정(데이터 마이닝 마법사)
열 콘텐츠 및 데이터 형식 지정(데이터 마이닝 마법사)