다음을 통해 공유


데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)

데이터 마이닝 알고리즘은 데이터 마이닝 모델을 만드는 메커니즘입니다. 모델을 만들기 위해 알고리즘은 먼저 데이터 집합을 분석한 다음 특정 패턴과 추세를 찾습니다. 알고리즘은 이 분석 결과를 사용하여 마이닝 모델의 매개 변수를 정의합니다. 그런 다음 이러한 매개 변수를 전체 데이터 집합에 적용하여 동작 가능한 패턴과 자세한 통계를 추출합니다.

알고리즘이 만드는 마이닝 모델은 다음과 같은 다양한 형태가 될 수 있습니다.

  • 트랜잭션에서 제품이 그룹화되는 방법을 설명하는 일련의 규칙

  • 특정 고객이 제품을 구입할지 여부를 예측하는 의사 결정 트리

  • 판매를 예측하는 수학적 모델

  • 데이터 집합의 사례 간 관계를 설명하는 일련의 클러스터

Microsoft SQL Server Analysis Services에서는 데이터 마이닝 솔루션에서 사용할 수 있는 여러 가지 알고리즘을 제공합니다. 이러한 알고리즘은 데이터 마이닝에 사용할 수 있는 모든 알고리즘의 하위 집합입니다. 데이터 마이닝용 OLE DB 사양과 호환되는 타사 알고리즘을 사용할 수도 있습니다. 타사 알고리즘에 대한 자세한 내용은 플러그 인 알고리즘을 참조하십시오.

데이터 마이닝 알고리즘 유형

Analysis Services에는 다음과 같은 알고리즘 유형이 포함되어 있습니다.

  • 데이터 집합의 다른 특성을 기반으로 하나 이상의 불연속 변수를 예측하는 분류 알고리즘. 분류 알고리즘의 예로 Microsoft 의사 결정 트리 알고리즘을 들 수 있습니다.

  • 데이터 집합의 다른 특성을 기반으로 수익 또는 손실과 같은 하나 이상의 연속 변수를 예측하는 회귀 알고리즘. 회귀 알고리즘의 예로 Microsoft 시계열 알고리즘을 들 수 있습니다.

  • 데이터를 속성이 유사한 항목의 그룹 또는 클러스터로 나누는 세그먼트화 알고리즘. 세그먼트화 알고리즘의 예로 Microsoft 클러스터링 알고리즘을 들 수 있습니다.

  • 데이터 집합에 있는 여러 특성 사이의 상관 관계를 찾는 연결 알고리즘. 이러한 종류의 알고리즘은 시장 바구니 분석에 사용할 수 있는 연결 규칙을 만드는 데 가장 일반적으로 적용됩니다. 연결 알고리즘의 예로 Microsoft 연결 알고리즘을 들 수 있습니다.

  • 웹 경로 흐름과 같이 데이터에서 자주 사용하는 시퀀스 또는 에피소드를 요약하는 시퀀스 분석 알고리즘. 시퀀스 분석 알고리즘의 예로 Microsoft 시퀀스 클러스터링 알고리즘을 들 수 있습니다.

알고리즘 적용

특정 비즈니스 태스크에 적합한 알고리즘을 선택하는 것은 결코 쉽지 않습니다. 동일한 비즈니스 태스크를 수행하기 위해 여러 알고리즘을 사용할 수 있지만 이렇게 하면 각 알고리즘에서 다른 결과를 생성하며 일부 알고리즘에서는 두 개 이상의 결과 유형을 생성할 수 있습니다. 예를 들어 의사 결정 트리가 최종 마이닝 모델에 영향을 미치지 않는 열을 식별할 수 있기 때문에 예측하거나 데이터 집합의 열 수를 줄이는 데 Microsoft 의사 결정 트리 알고리즘을 사용할 수 있습니다.

또한 알고리즘을 개별적으로 사용할 필요도 없습니다. 즉 하나의 데이터 마이닝 솔루션에서 데이터를 탐색하는 데 몇 가지 알고리즘을 사용하고 해당 데이터를 기반으로 특정 결과를 예측하는 데 다른 알고리즘을 사용할 수 있습니다. 예를 들어 패턴을 인식하는 클러스터링 알고리즘을 사용하여 데이터를 속성이 거의 유사한 그룹으로 나눈 다음 결과를 사용하여 보다 나은 의사 결정 트리 모델을 만들 수 있습니다. 하나의 솔루션 내에서 여러 알고리즘을 사용하여 여러 개별 태스크를 수행할 수 있습니다. 예를 들어 회귀 트리 알고리즘을 사용하여 재무 예측 정보를 얻을 수 있으며 규칙 기반 알고리즘을 사용하여 시장 바구니 분석을 수행할 수 있습니다.

마이닝 모델로 값을 예측하고 데이터를 요약할 수 있을 뿐만 아니라 숨겨진 상관 관계도 찾을 수 있습니다. 다음 표에서는 데이터 마이닝 솔루션에 적합한 알고리즘을 선택하는 데 도움이 되도록 특정 태스크에 사용할 알고리즘을 제안합니다.

태스크

사용할 Microsoft 알고리즘

불연속 특성 예측

예: 대상 메일 캠페인의 대상이 제품을 구입할지 여부 예측

Microsoft 의사 결정 트리 알고리즘

Microsoft Naive Bayes 알고리즘

Microsoft 클러스터링 알고리즘

Microsoft 신경망 알고리즘(Analysis Services - 데이터 마이닝)

연속 특성 예측.

예: 내년 판매액 예측

Microsoft 의사 결정 트리 알고리즘

Microsoft 시계열 알고리즘

시퀀스 예측.

예: 회사 웹 사이트의 클릭 동향 분석 수행

Microsoft 시퀀스 클러스터링 알고리즘

트랜잭션에서 공통 항목 그룹 찾기.

예: 시장 바구니 분석을 사용하여 고객에게 추가 제품 구매 제안

Microsoft 연결 알고리즘

Microsoft 의사 결정 트리 알고리즘

유사 항목 그룹 찾기.

예: 특성 간의 관계를 보다 잘 이해하기 위해 인구 통계 데이터를 그룹으로 나눔

Microsoft 클러스터링 알고리즘

Microsoft 시퀀스 클러스터링 알고리즘

각 모델에서 다른 결과 유형을 반환하기 때문에 Analysis Services에서는 각 알고리즘에 대해 별도의 뷰어를 제공합니다. Analysis Services에서 마이닝 모델을 찾으면 데이터 마이닝 디자이너의 마이닝 모델 뷰어 탭에 적절한 모델 뷰어를 사용하여 해당 모델이 표시됩니다. 자세한 내용은 데이터 마이닝 모델 보기를 참조하십시오.

알고리즘 세부 사항

다음 표에서는 각 알고리즘에 사용할 수 있는 정보 유형에 대한 링크를 제공합니다.

  • 알고리즘 기본 사항 설명   알고리즘이 수행하는 작업과 알고리즘 작동 방식의 기본적인 내용을 설명하고 알고리즘이 유용할 수 있는 비즈니스 시나리오를 제공합니다.

  • 기술 참조   알고리즘의 동작을 제어하고 모델 결과를 사용자 지정하기 위해 설정할 수 있는 매개 변수를 나열합니다. 또한 알고리즘 구현, 성능 팁 및 데이터 요구 사항에 대한 추가 기술 정보를 제공합니다.

  • 모델 쿼리   각 모델 유형과 함께 사용할 수 있는 쿼리에 대한 예를 제공합니다.모델을 쿼리하여 모델의 패턴에 대해 자세히 알아보거나 해당 패턴을 기반으로 예측을 만들 수 있습니다.

  • 마이닝 모델 콘텐츠   모든 모델 유형에 일반적인 구조로 정보가 저장되는 방식과 정보를 해석하는 방법을 설명합니다. 모델을 작성한 후에는 BI Development Studio에서 제공하는 뷰어를 사용하여 모델을 탐색하거나 DMX로 쿼리를 작성하여 모델 콘텐츠에서 직접 정보를 반환할 수 있습니다.

알고리즘 기본 사항 설명

기술 참조

쿼리

마이닝 모델 콘텐츠

Microsoft 연결 알고리즘

Microsoft 연결 알고리즘 기술 참조-

연결 모델 쿼리(Analysis Services - 데이터 마이닝)

연결 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)

Microsoft 클러스터링 알고리즘

Microsoft 클러스터링 알고리즘 기술 참조

클러스터링 모델 쿼리(Analysis Services - 데이터 마이닝)

클러스터링 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)

Microsoft 의사 결정 트리 알고리즘

Microsoft 의사 결정 트리 알고리즘 기술 참조

의사 결정 트리 모델 쿼리(Analysis Services - 데이터 마이닝)

의사 결정 트리 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)

Microsoft 선형 회귀 알고리즘

Microsoft 선형 회귀 알고리즘 기술 참조

선형 회귀 모델 쿼리(Analysis Services - 데이터 마이닝)

선형 회귀 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)

Microsoft 로지스틱 회귀 알고리즘

Microsoft 로지스틱 회귀 알고리즘 기술 참조

로지스틱 회귀 모델 쿼리(Analysis Services - 데이터 마이닝)

로지스틱 회귀 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)

Microsoft Naive Bayes 알고리즘

Microsoft Naive Bayes 알고리즘 기술 참조

Naive Bayes 모델 쿼리(Analysis Services - 데이터 마이닝)

Naive Bayes 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)

Microsoft 신경망 알고리즘(Analysis Services - 데이터 마이닝)

Microsoft 신경망 알고리즘 기술 참조

신경망 모델 쿼리(Analysis Services - 데이터 마이닝)

신경망 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)

Microsoft 시퀀스 클러스터링 알고리즘

Microsoft 시퀀스 클러스터링 알고리즘 기술 참조(Analysis Services - 데이터 마이닝)

시퀀스 클러스터링 모델 쿼리(Analysis Services - 데이터 마이닝)

시퀀스 클러스터링 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)

Microsoft 시계열 알고리즘

Microsoft 시계열 알고리즘 기술 참조

시계열 모델 쿼리(Analysis Services - 데이터 마이닝)

시계열 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)