다음을 통해 공유


예측 만들기(기본 데이터 마이닝 자습서)

마이닝 모델의 정확도를 테스트하고 결과에 만족한다고 결정한 후에는 데이터 마이닝 Designer 마이닝 모델 예측 탭의 예측 쿼리 작성기를 사용하여 예측을 생성할 수 있습니다.

예측 쿼리 작성기에는 세 가지 뷰가 있습니다. 디자인쿼리 뷰를 사용하여 쿼리를 빌드하고 검사할 수 있습니다. 그런 다음, 쿼리를 실행하고 결과 보기에서 결과를 볼 수 있습니다.

모든 예측 쿼리는 DMX(Data Mining Extensions) 언어를 사용합니다. DMX의 구문은 T-SQL의 구문과 비슷하지만 데이터 마이닝 개체에 대한 쿼리에 실행됩니다. DMX 구문은 복잡하지 않지만 이와 같은 쿼리 작성기 또는 Office용 SQL Server 데이터 마이닝 Add-Ins 사용하여 입력 및 빌드 식을 훨씬 쉽게 선택할 수 있으므로 기본 사항을 배우는 것이 좋습니다.

쿼리 만들기

예측 쿼리를 만드는 첫 번째 단계는 마이닝 모델과 입력 테이블을 선택하는 것입니다.

모델과 입력 테이블을 선택하려면

  1. 데이터 마이닝 Designer 마이닝 모델 예측 탭의 마이닝 모델 상자에서 모델 선택을 클릭합니다.

  2. 마이닝 모델 선택 대화 상자에서 트리를 통해 대상 메일링 구조로 이동하고, 구조를 확장하고, 를 선택한 TM_Decision_Tree다음, 확인을 클릭합니다.

  3. 입력 테이블 선택 상자에서 사례 테이블 선택을 클릭합니다.

  4. 테이블 선택 대화 상자의 데이터 원본 목록에서 데이터 원본 뷰 Adventure Works DW 다차원 2012를 선택합니다.

  5. 테이블/뷰 이름에서 ProspectiveBuyer(dbo) 테이블을 선택한 다음 확인을 클릭합니다.

    테이블은 ProspectiveBuyervTargetMail 사례 테이블과 가장 유사합니다.

열 매핑

입력 테이블을 선택하면 열 이름을 기반으로 마이닝 모델과 입력 테이블 간에 기본 매핑이 만들어집니다. 구조의 열 중 적어도 하나 이상의 열이 외부 데이터의 열과 일치해야 합니다.

중요

모델의 정확도를 결정하는 데 사용하는 데이터에는 예측 가능한 열에 매핑될 수 있는 열이 포함되어 있어야 합니다. 이러한 열이 존재하지 않는 경우 빈 값으로 열을 만들 수 있지만 이 열은 예측 가능한 열과 동일한 데이터 형식을 사용해야 합니다.

입력을 모델에 매핑하려면

  1. 마이닝 모델 창을 입력 테이블 선택 창에 연결하는 줄을 마우스 오른쪽 단추로 클릭하고 연결 수정을 선택합니다.

    모든 열이 매핑되지는 않았습니다. 여러 테이블 열에 대한 매핑을 추가합니다. 또한 열이 더 잘 일치하도록 현재 날짜 열을 기반으로 새 생년월일 열을 생성합니다.

  2. 표 열 아래의 셀을 Bike Buyer 클릭하고 드롭다운에서 ProspectiveBuyer.Unknown을 선택합니다.

    이는 예측 가능한 열인 [Bike Buyer]를 입력 테이블 열에 매핑합니다.

  3. 확인을 클릭합니다.

  4. 솔루션 탐색기대상 메일링 데이터 원본 보기를 마우스 오른쪽 단추로 클릭하고 Designer 보기를 선택합니다.

  5. Table, ProspectiveBuyer를 마우스 오른쪽 단추로 클릭하고 새 명명된 계산을 선택합니다.

  6. 명명된 계산 만들기 대화 상자에서 열 이름에 를 입력합니다calcAge.

  7. 설명생년월일을 기준으로 나이 계산을 입력합니다.

  8. 상자에 을 입력 DATEDIFF(YYYY,[BirthDate],getdate()) 한 다음 확인을 클릭합니다.

    입력 테이블에 모델에 있는 열에 해당하는 Age 열이 없으므로 이 식을 사용하여 입력 테이블의 BirthDate 열에서 고객 연령을 계산할 수 있습니다. Age는 자전거 구매를 예측하는 데 가장 영향력 있는 열로 확인되었으므로 모델과 입력 테이블 모두에 존재해야 합니다.

  9. 데이터 마이닝 Designer 마이닝 모델 예측 탭을 선택하고 연결 수정 창을 다시 엽니다.

  10. 표 열 아래에서 Age 셀을 클릭하고 드롭다운에서 ProspectiveBuyer.calcAge를 선택합니다.

    경고

    목록에 열이 표시되지 않는 경우 디자이너에 로드되는 데이터 원본 뷰의 정의를 새로 고쳐야 할 수 있습니다. 이렇게 하려면 파일 메뉴에서 모두 저장을 선택한 다음 디자이너에서 프로젝트를 닫고 다시 엽니다.

  11. 확인을 클릭합니다.

예측 쿼리 디자인

  1. 마이닝 모델 예측 탭의 도구 모음에 있는 첫 번째 단추는 디자인 보기로 전환/결과 보기로 전환/쿼리 보기로 전환 단추입니다. 이 단추의 아래쪽 화살표를 클릭하고 디자인을 선택합니다.

  2. 마이닝 모델 예측 탭의 표에서 원본 열의 첫 번째 빈 행에 있는 셀을 클릭한 다음 예측 함수를 선택합니다.

  3. 예측 함수 행의 필드 열에서 를 선택합니다PredictProbability.

    같은 행의 별칭 열에 결과의 확률을 입력합니다.

  4. 위의 마이닝 모델 창에서 [Bike Buyer]를 선택하고 Criteria/Argument 셀로 끌어옵니다.

    놓으면 [TM_Decision_Tree]. [Bike Buyer]가 Criteria/Argument 셀에 나타납니다.

    이렇게 하면 PredictProbability 함수의 대상 열이 지정됩니다. 함수에 대한 자세한 내용은 DMX(데이터 마이닝 확장) 함수 참조를 참조하세요.

  5. 원본 열에서 다음 빈 행을 클릭한 다음 마이닝 모델 TM_Decision_Tree 선택합니다.

  6. 행의 TM_Decision_Tree필드 열에서 를 선택합니다 Bike Buyer.

  7. 행의 TM_Decision_TreeCriteria/Argument 열에 를 입력합니다 =1.

  8. 원본 열에서 다음 빈 행을 클릭한 다음, ProspectiveBuyer 테이블을 선택합니다.

  9. 행의 ProspectiveBuyer필드 열에서 ProspectiveBuyerKey를 선택합니다.

    이렇게 하면 자전거 구매 가능성이 있는 고객과 구매 가능성이 없는 고객을 식별할 수 있도록 예측 쿼리에 고유 식별자가 추가됩니다.

  10. 표에 5개의 행을 더 추가합니다. 각 행에 대해 Source로 ProspectiveBuyer 테이블을 선택한 다음 필드 셀에 다음 열을 추가합니다.

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

마지막으로 쿼리를 실행하고 결과를 찾아봅니다.

예측 쿼리 작성기에도 다음 컨트롤이 포함됩니다.

  • 검사 상자 표시

    디자이너에서 삭제할 필요 없이 쿼리에서 절을 제거할 수 있습니다. 이 확인란은 복잡한 쿼리로 작업할 때 DMX를 복사하여 창에 붙여 넣을 필요 없이 구문을 보존하려는 경우에 유용할 수 있습니다.

  • 그룹

    선택한 줄의 시작 부분에 여는(왼쪽) 괄호를 삽입하거나 현재 줄의 끝에 닫는(오른쪽) 괄호를 삽입합니다.

  • AND/OR

    AND 현재 함수 또는 열 바로 뒤에 연산자 또는 OR 연산자를 삽입합니다.

쿼리를 실행하고 결과를 확인하려면

  1. 마이닝 모델 예측 탭에서 결과 단추를 선택합니다.

  2. 쿼리가 실행되고 결과가 표시되면 해당 결과를 검토할 수 있습니다.

    마이닝 모델 예측 탭에는 자전거 구매자가 될 가능성이 있는 잠재 고객의 연락처 정보가 표시됩니다. 결과 열의 확률은 예측이 올바른 확률을 나타냅니다. 이러한 결과를 사용하여 메일 대상으로 삼을 잠재 고객을 결정할 수 있습니다.

  3. 이때 결과를 저장할 수 있습니다. 세 가지 옵션이 있습니다.

    • 결과에서 데이터 행을 마우스 오른쪽 단추로 클릭하고 복사 를 선택하여 해당 값(및 열 머리글)만 클립보드에 저장합니다.

    • 결과에서 행을 마우스 오른쪽 단추로 클릭하고 모두 복사 를 선택하여 열 머리글을 포함한 전체 결과 집합을 클립보드에 복사합니다.

    • 쿼리 결과 저장을 클릭하여 다음과 같이 결과를 데이터베이스에 직접 저장합니다.

      1. 데이터 마이닝 쿼리 결과 저장 대화 상자에서 데이터 원본을 선택하거나 새 데이터 원본을 정의합니다.

      2. 쿼리 결과를 포함할 테이블의 이름을 입력합니다.

      3. DSV에 추가 옵션을 사용하여 테이블을 만들고 기존 데이터 원본 뷰에 추가합니다. 이는 학습 데이터, 예측 원본 데이터 및 쿼리 결과와 같은 모델에 대한 모든 관련 테이블을 동일한 데이터 원본 뷰에 유지하려는 경우에 유용합니다.

      4. 존재하는 경우 덮어쓰기 옵션을 사용하여 기존 테이블을 최신 결과로 업데이트합니다.

        예측 쿼리에 열을 추가한 경우, 예측 쿼리에서 열의 이름 또는 데이터 형식을 변경한 경우, 대상 테이블에서 ALTER 문을 실행한 경우 테이블을 덮어 쓰려면 이 옵션을 사용해야 합니다.

        또한 여러 열의 이름이 같은 경우(예: 기본 열 이름 ) 이름이 중복된 열에 대한 별칭을 만들어야 합니다. 그렇지 않으면 디자이너가 결과를 SQL Server 저장하려고 할 때 오류가 발생합니다. 그 이유는 SQL Server가 여러 열에서 동일한 이름을 갖도록 허용하지 않기 때문입니다.

        자세한 내용은 데이터 마이닝 쿼리 결과 저장 대화 상자(마이닝 모델 예측 뷰)를 참조하세요.

단원의 다음 태스크

구조 데이터에 드릴스루 사용(기본 데이터 마이닝 자습서)

참고 항목

예측 쿼리 작성기를 사용하여 예측 쿼리 만들기