다음을 통해 공유


데이터 마이닝 도구

Microsoft SQL Server Analysis Services는 데이터 마이닝 솔루션을 만드는 데 사용할 수 있는 다음 도구를 제공합니다.

  • SSDT(SQL Server Data Tools)의 데이터 마이닝 마법사를 사용하면 관계형 데이터 원본 또는 큐브의 다차원 데이터를 사용하여 마이닝 구조 및 마이닝 모델을 쉽게 만들 수 있습니다.

    마법사에서 사용할 데이터를 선택한 다음 클러스터링, 신경망 또는 시계열 모델링과 같은 특정 데이터 마이닝 기술을 적용합니다.

  • 모델 뷰어는 마이닝 모델을 만든 후 탐색하기 위해 SQL Server Management Studio 및 SSDT(SQL Server Data Tools)에서 모두 제공됩니다. 각 알고리즘에 맞게 조정된 뷰어를 사용하여 모델을 찾아보거나 모델 콘텐츠 뷰어를 사용하여 더 자세히 분석할 수 있습니다.

  • 예측 쿼리 작성기는 예측 쿼리를 만드는 데 도움이 되도록 SQL Server Management Studio와 SSDT(SQL Server Data Tools) 모두에 제공됩니다. 홀드아웃 데이터 세트 또는 외부 데이터에 대해 모델의 정확도를 테스트하거나 교차 유효성 검사를 사용하여 데이터 집합의 품질을 평가할 수도 있습니다.

  • SQL Server Management Studio는 Analysis Services 인스턴스에 배포된 기존 데이터 마이닝 솔루션을 관리하는 인터페이스입니다. 구조체와 모델을 다시 처리하여 데이터를 업데이트할 수 있습니다.

  • SQL Server Integration Services에는 데이터를 정리하고, 예측 만들기 및 모델 업데이트와 같은 작업을 자동화하고, 텍스트 마이닝 솔루션을 만드는 데 사용할 수 있는 도구가 포함되어 있습니다.

다음 섹션에서는 SQL Server의 데이터 마이닝 도구에 대한 자세한 정보를 제공합니다.

데이터 마이닝 마법사

데이터 마이닝 마법사를 사용하여 데이터 마이닝 솔루션 만들기를 시작합니다. 마법사는 빠르고 쉽고 데이터 마이닝 구조 및 초기 관련 마이닝 모델을 만드는 프로세스를 안내하며 알고리즘 유형 및 데이터 원본을 선택하고 분석에 사용되는 사례 데이터를 정의하는 작업을 포함합니다.

자세한 정보: 데이터 마이닝 마법사(Analysis Services - 데이터 마이닝)

데이터 마이닝 디자이너

데이터 마이닝 마법사를 사용하여 마이닝 구조 및 마이닝 모델을 만든 후에는 SSDT(SQL Server Data Tools) 또는 SQL Server Management Studio의 데이터 마이닝 디자이너를 사용하여 기존 모델 및 구조를 사용할 수 있습니다.

디자이너에는 다음 작업에 대한 도구가 포함되어 있습니다.

  • 마이닝 구조의 속성을 수정하고, 열을 추가하고, 열 별칭을 만들고, 범주화 메서드 또는 값의 예상 분포를 변경합니다.

  • 기존 구조에 새 모델을 추가합니다. 모델을 복사하거나, 모델 속성 또는 메타데이터를 변경하거나, 마이닝 모델에 대한 필터를 정의합니다.

  • 모델 내의 패턴 및 규칙을 찾아봅니다. 연결 또는 의사 결정 트리를 탐색합니다. 자세한 통계를 얻습니다.

    사용자 지정 뷰어는 데이터를 분석하고 데이터 마이닝에서 표시되는 패턴을 탐색하는 데 도움이 되도록 모델의 각 시간에 대해 제공됩니다.

  • 리프트 차트를 만들거나 모델의 수익 곡선을 분석하여 모델의 유효성을 검사합니다. 분류 행렬을 사용하여 모델을 비교하거나 교차 유효성 검사를 사용하여 데이터 집합 및 해당 모델의 유효성을 검사합니다.

  • 기존 마이닝 모델에 대한 예측 및 콘텐츠 쿼리를 만듭니다. 일회성 쿼리를 작성하거나 외부 데이터의 전체 테이블에 대한 예측을 생성하도록 쿼리를 설정합니다.

자세한 정보: 데이터 마이닝 디자이너

SQL Server Management Studio

마이닝 모델을 만들고 서버에 배포한 후 SQL Server Management Studio를 사용하여 데이터 마이닝 개체를 호스트하는 Analysis Services 데이터베이스를 관리할 수 있습니다. 또한 모델 탐색, 새 데이터 처리, 예측 생성 등의 모델을 사용하는 태스크를 계속 수행할 수도 있습니다.

Management Studio에는 DMX(데이터 마이닝 확장) 쿼리를 디자인하고 실행하는 데 사용할 수 있는 쿼리 편집기 또는 XMLA를 사용하여 데이터 마이닝 개체로 작업하는 데 사용할 수 있는 쿼리 편집기도 포함되어 있습니다.

Integration Services 데이터 마이닝 태스크 및 변환

SQL Server Integration Services는 데이터 마이닝을 지원하는 많은 구성 요소를 제공합니다.

Integration Services의 일부 도구는 예측, 모델 빌드 및 처리를 비롯한 일반적인 데이터 마이닝 작업을 자동화하는 데 도움이 되도록 설계되었습니다. 예시:

  • 새 고객으로 데이터 세트를 업데이트할 때마다 모델을 자동으로 업데이트하는 Integration Services 패키지 만들기

  • 사례 레코드의 사용자 지정 세분화 또는 사용자 지정 샘플링을 수행합니다.

  • 매개 변수에서 전달된 모델을 자동으로 생성합니다.

그러나 다른 프로세스에 대한 입력으로 패키지 워크플로에서 데이터 마이닝을 사용할 수도 있습니다. 예시:

  • 모델에서 생성된 확률 값을 사용하여 텍스트 마이닝 또는 기타 분류 작업의 가중치 점수를 사용합니다.

  • 이전 데이터를 기반으로 예측을 자동으로 생성하고 해당 값을 사용하여 새 데이터의 유효성을 평가합니다.

  • 로지스틱 회귀를 사용하여 들어오는 고객을 위험별로 분할합니다.

자세한 정보: 데이터 마이닝 솔루션 관련 프로젝트

참고 항목

DMX(데이터 마이닝 확장) 참조
마이닝 모델 태스크 및 방법
마이닝 모델 뷰어 태스크 및 방법
데이터 마이닝 솔루션