시퀀스 클러스터링 마이닝 모델 구조 만들기(중급 데이터 마이닝 자습서)
적용 대상: SQL Server 2016 Preview
시퀀스 클러스터링 마이닝 모델을 만드는 첫 번째 단계는 데이터 마이닝 마법사를 사용하여 Microsoft 시퀀스 클러스터링 알고리즘을 기반으로 하는 새 마이닝 구조 및 마이닝 모델을 만드는 것입니다.
시장 바구니 분석에 사용한 동일한 데이터 원본 뷰를 사용 합니다 하지만 포함 된 열을 추가 합니다는 시퀀스 식별자입니다. 이 시나리오에서 시퀀스는 고객이 시장 바구니에 항목을 추가한 순서를 의미합니다.
또한 고객을 인구 통계별로 그룹화하는 모델 중 하나에 사용되는 일부 열을 추가합니다.
시퀀스 클러스터링 구조 및 모델을 만들려면
솔루션 탐색기에서 SQL Server Data Tools(SSDT), 를 마우스 오른쪽 단추로 클릭 마이닝 구조 선택한 새 마이닝 구조합니다.
데이터 마이닝 마법사 시작 페이지에서 다음을 클릭합니다.
에 정의 방법 선택 페이지에서 기존 관계형 데이터베이스 또는 데이터 웨어하우스 로부터 을 선택한 다음 클릭 다음합니다.
에 데이터 마이닝 구조 만들기 페이지에서 옵션 마이닝 구조에 마이닝 모델 만들기 을 선택 합니다. 그런 다음, 드롭다운 목록에서 옵션에 대 한 클릭 사용할 데이터 마이닝 기술을 사용 하 시겠습니까?, 선택한 Microsoft 시퀀스 클러스터링합니다. 다음을 클릭합니다.
데이터 원본 뷰 선택 페이지가 나타납니다. 아래에서 사용 가능한 데이터 원본 뷰, 선택, 주문합니다.
Orders는 시장 바구니 시나리오에 사용한 동일한 데이터 원본 뷰입니다. 이 데이터 원본 뷰를 만들지 않은 경우 참조 중첩 된 테이블 및 #40, 중급 데이터 마이닝 자습서 및 #41; 데이터 원본 뷰 추가합니다.
다음을 클릭합니다.
에 테이블 유형 지정 페이지에서는 사례 옆에 vAssocSeqOrders 테이블을 마우스 선택는 중첩 옆에 vAssocSeqLineItems 테이블입니다. 다음을 클릭합니다.
참고
선택할 때 오류가 발생 하는 경우는 사례 또는 중첩 확인란는 것이 데이터 원본 뷰의 조인이 올바르지 않습니다. 중첩된 테이블 vAssocSeqLineItems, 사례 테이블에 연결 해야 vAssocSeqOrders를 다 대 일 조인으로 합니다. 조인 선을 마우스 오른쪽 단추로 클릭한 다음 조인 방향을 반대로 바꿔 관계를 편집할 수 있습니다. 자세한 내용은 참조 만들기 또는 관계 편집 대화 상자 및 #40; Analysis Services-다차원 데이터 및 #41;합니다.에 학습 데이터 지정 페이지에서 다음과 같이 확인란을 선택 하 여 모델에 사용할 열을 선택 합니다.
IncomeGroup선택은 입력 확인란입니다.
이 열에는 클러스터링에 사용할 수 있는 고객에 대한 유용한 정보가 들어 있습니다. 첫 번째 모델에서 이 열을 사용한 다음 두 번째 모델에서 무시합니다.
OrderNumber선택은 키 확인란입니다.
이 필드는 식별자로 사례 테이블 또는 키합니다. 일반적으로 키에 클러스터링에 유용하지 않은 고유 값이 포함되어 있으므로 사례 테이블의 키 필드를 입력으로 사용할 수 없습니다.
지역선택은 입력 확인란입니다.
이 열에는 클러스터링에 사용할 수 있는 고객에 대한 유용한 정보가 들어 있습니다. 첫 번째 모델에서 이 열을 사용한 다음 두 번째 모델에서 무시합니다.
LineNumber선택은 키 및 입력 확인란입니다.
LineNumber 중첩된 테이블에 대 한 필드를 식별자로 사용 됩니다 또는 시퀀스 키합니다. 중첩 테이블의 키는 항상 입력으로 사용해야 합니다.
모델선택은 입력 및 예측 가능 확인란입니다.
선택 항목 올바른지를 클릭 한 다음 확인 다음합니다.
에 지정 열 내용 및 데이터 형식을 페이지, 모눈 열, 콘텐츠 형식 및 다음 표에 표시 된 데이터 형식이 포함 되어 있는지 확인 한 다음 클릭 다음합니다.
테이블/열 내용 유형 데이터 형식 IncomeGroup 불연속 텍스트 OrderNumber Key 텍스트 Region 불연속 텍스트 vAssocSeqLineItems Line Number 키 시퀀스 Long Model 불연속 텍스트 에 테스트 집합 만들기 페이지에서 변경 된 테스트용 데이터 비율 을 20으로 클릭 한 다음 다음합니다.
에 마법사 완료 페이지에 대 한는 마이닝 구조 이름, 형식 Sequence Clustering with Region합니다.
에 대 한는 마이닝 모델 이름, 형식 Sequence Clustering with Region합니다.
확인은 드릴스루 허용 상자를 선택한 다음 클릭 마침합니다.