연결 마법사(Excel용 데이터 마이닝 클라이언트)
연결 마법사를 사용하면 Microsoft 연결 규칙 알고리즘을 사용하여 데이터 마이닝 모델을 만들 수 있습니다. 이러한 마이닝 모델은 권장 사항 시스템을 만드는 데 특히 유용합니다.
작동 방식은 Microsoft 연결 규칙 알고리즘이 트랜잭션 또는 이벤트로 구성된 데이터 세트를 검사하고 자주 함께 표시되는 조합을 찾는 것입니다. 수천 개의 조합이 있을 수 있지만 더 찾거나 덜 찾고 가장 가능성이 높은 조합만 유지하도록 알고리즘을 사용자 지정할 수 있습니다.
연결 분석을 많은 문제에 적용할 수 있습니다. 이 방법이 가장 많이 적용되는 예는 함께 구매되는 빈도가 높은 개별 제품을 찾는 시장 바구니 분석입니다. 그런 다음 이 정보를 사용해서 고객이 이미 구입한 항목을 기반으로 고객에게 제품을 추천할 수 있습니다.
연결 마법사 사용
데이터 마이닝 리본에서 연결을 클릭합니다.
원본 데이터 선택 페이지에서 Excel 테이블 또는 데이터 범위를 선택하고 다음을 클릭합니다.
샘플 데이터 통합 문서의 연결 탭에는 각 트랜잭션에서 여러 제품을 선택한 경우 또는 분석하려는 고객당 구매 기록이 여러 개 있는 경우 등과 관련해서 트랜잭션 데이터의 일반적인 배열 방법에 대한 예가 포함되어 있습니다.
외부 데이터를 사용하여 연결 마법사를 사용하여 연결 모델을 빌드하려면 먼저 Excel에 데이터를 추가하고 데이터를 평면화 해야 합니다. 연결 모델링을 위해 데이터를 준비하는 방법에 대한 자세한 내용은 온라인 설명서 SQL Server 중첩 테이블(Analysis Services - 데이터 마이닝)을 참조하세요.
연결 페이지에서 트랜잭션을 식별하는 열을 선택합니다.
시장 바구니 모델에서 이 식별자는 모델을 작성하려는 단위를 나타냅니다. 먼저 시간별로 개별 고객이 구입한 항목을 분석할지 또는 여러 고객이 포함된 많은 수의 트랜잭션을 분석할지를 결정합니다. 첫 번째 경우에는 고객 ID를 선택해야 하고, 두 번째 경우에는 구매 주문 또는 기타 트랜잭션 ID를 선택해야 합니다.
항목에서 연결을 찾아야 하는 항목이 포함된 열을 선택합니다.
예를 들어 시장 바구니 모델에서는 자주 함께 판매된 제품을 분석하기 위해 제품 필드를 선택합니다. 개별 제품이 너무 많아서 상관 관계를 효과적으로 확인할 수 없는 경우에는 제품 범주 또는 하위 범주 필드를 선택할 수 있습니다.
임계값에서 모델의 출력을 제어하거나 영향을 주는 값을 설정할 수 있습니다.
최소 지지도. 항목 그룹이 중요하게 고려되도록 표시할 횟수를 지정합니다. 이 조건을 충족하지 않는 항목 조합은 알고리즘에서 무시됩니다. 예를 들어 최소 10회 이상 함께 나타난 항목 집합만 확인할 수 있습니다.
최소 규칙 확률입니다. 규칙을 저장하는 데 필요한 최소 확률 값을 지정합니다. 전체 데이터 집합을 분석해서 모든 조합을 찾은 후 확률이 계산됩니다. 임계값이 낮으면 마법사가 느슨한 상관 관계의 항목만 연결합니다. 임계값이 너무 높으면 지원 데이터가 부족한 일부 연결이 생략될 수 있습니다.
일반적으로 이러한 값을 변경하면 다음과 같은 효과가 나타납니다.
지지도 값을 낮추면 발견되는 조합의 개수가 증가합니다.
최대 지지도를 낮추면 의미가 별로 없는데 자주 나타나는 항목을 제외시킬 수 있습니다.
규칙 확률을 낮추는 것은 전체 데이터 집합의 컨텍스트에서 조합이 중요하게 고려되기 위해 충족해야 하는 요구 사항을 낮추는 것입니다.
팁: 다양한 지원 및 확률 조합을 사용하여 여러 마이닝 모델을 만드는 것이 좋습니다. 각 모델에 사용한 설정을 추적하려면 Excel용 데이터 마이닝 클라이언트에서 사용할 수 있는 문서 모델 마법사를 사용하고 자세한 보고서 옵션을 사용할 수 있습니다. 자세한 내용은 마이닝 모델 문서화(Excel용 데이터 마이닝 추가 기능)를 참조하세요.
필요에 따라 매개 변수 를 클릭하여 알고리즘 매개 변수를 변경하고 마이닝 모델의 동작을 사용자 지정합니다.
알고리즘 매개 변수 대화 상자에는 마법사에서 설정하는 모든 매개 변수와 MAXIMUM_SUPPORT와 같이 덜 일반적으로 사용되는 몇 가지 매개 변수가 포함됩니다. 이러한 매개 변수를 사용하는 방법에 대한 자세한 내용은 Microsoft 연결 알고리즘 기술 참조를 참조하세요.
마침 페이지에서 데이터 집합 및 모델의 고유한 이름을 입력합니다.
옵션에서 모델을 완료한 후 작업하는 방법을 정의합니다.
찾아보기. 모델이 준비되면 마법사에서 규칙, 항목 집합 및 연결을 설명하는 종속성 네트워크 그래프를 보여 주는 창이 열립니다.
연결 모델 뷰어에서 데이터를 해석하는 방법에 대한 자세한 내용은 연결 규칙 모델 검색을 참조하세요.
드릴스루를 사용하도록 설정합니다. 모델을 통해 기본 데이터에 액세스하려면 이 옵션을 선택합니다.
드릴스루는 특정 항목 집합을 클릭해서 원본 데이터를 보고 싶은 경우에 유용합니다.
임시 모델 사용. 모델을 서버에 저장하지 않으려면 이 옵션을 선택합니다. 임시 모델은 Excel을 닫을 때 삭제됩니다.
마법사는 가능한 모든 조합을 분석하고 항목 집합 및 규칙이 포함된 보고서를 만듭니다.
연결 모델에 대한 추가 정보
Microsoft 연결 규칙 알고리즘은 학습 데이터를 검사하여 트랜잭션에 함께 표시되는 항목을 찾습니다. 항목의 각 그룹은 항목 집합을 구성합니다. 그런 다음 알고리즘에서 각 항목 집합이 나타나는 횟수를 세고 전체 트랜잭션에서 각 항목 집합의 상대적 중요도를 계산합니다.
알고리즘은 이 항목 집합 정보를 사용하여 연결을 예측하거나 권장 사항을 만드는 데 사용할 수 있는 규칙을 생성합니다. 예를 들어 "저자 1과 저자 2의 책을 구매한 사용자는 저자 3의 책을 구매할 가능성이 높다"라는 규칙을 만들 수 있습니다. 각 권장 사항에는 연결의 강도를 기반으로 확률이 할당됩니다.
요구 사항
연결 마법사를 사용하려면 Analysis Services 데이터베이스에 연결해야 합니다.
원본 데이터는 트랜잭션 테이블로 구성되어야 하며 트랜잭션 식별자를 포함하는 열 한 개를 포함해야 합니다. 이 트랜잭션 열은 각 항목 그룹을 식별하는 것으로, 그룹에서 개별 항목에 대한 이름 또는 ID를 저장하는 두 번째 열인 항목 ID와 일 대 다 관계여야 합니다.
개념상으로 쇼핑 카트 예를 떠올리면 가장 이해하기 쉽습니다. 쇼핑 카트에 ID가 할당되면 쇼핑 카트 ID는 트랜잭션에 대한 식별자 역할을 합니다. 감자 또는 우유와 같은 쇼핑 카트의 각 항목은 해당 트랜잭션의 멤버입니다. 연결 알고리즘은 트랜잭션 간에 항목을 추적할 수 있습니다. 예를 들어 단일 트랜잭션 내에 감자와 우유가 표시되는 횟수를 결정할 수 있습니다.
원본 데이터는 트랜잭션 식별자 열을 기준으로 정렬되어야 합니다.
참고 항목
데이터 마이닝 모델 만들기
연결 규칙 모델 찾아보기
시장 바구니 분석(Excel용 테이블 분석 도구)
종속성 네트워크 다이어그램 연습(데이터 마이닝 추가 기능)