TopCount(DMX)

아티클
05/07/2013

식에서 지정한 수만큼 맨 위 행을 내림차순으로 반환합니다.

구문

TopCount(<table expression>, <rank expression>, <count>)

적용 대상

<table column reference>와 같은 테이블을 반환하는 식 또는 테이블을 반환하는 함수입니다.

반환 형식

주의

<rank expression> 인수가 제공한 값에 따라 <table expression> 인수에 제공된 행의 내림차순이 결정되며 <count> 인수에 지정된 수만큼 맨 위 행이 반환됩니다.

TopCount 함수는 원래 연결 예측을 사용하고 일반적으로 SELECT TOP 및 ORDER BY 절을 포함하는 문으로 동일한 결과를 생성하기 위해 도입되었습니다. 연결 예측에 대해 더 나은 성능을 얻으려면 Predict (DMX) 함수를 사용하면 됩니다. 이 함수는 많은 예측이 반환되도록 지정할 수 있습니다.

그러나 TopCount를 사용해야 하는 상황이 있을 수 있습니다. 예를 들어 DMX는 하위 선택 문에서 TOP 한정자를 지원하지 않습니다. 또한 PredictHistogram(DMX) 함수는 TOP 추가를 지원하지 않습니다.

예

다음 예에서는 기본 데이터 마이닝 자습서를 사용하여 작성하는 연결 모델에 대한 예측 쿼리입니다. 쿼리는 동일한 결과를 반환하지만 첫 번째 예에서는 TopCount를 사용하며 두 번째 예에서는 Predict 함수를 사용합니다.

우선 중첩 테이블만 반환하는 예측 쿼리를 실행해 보면 TopCount의 작동 방식을 이해하는 데 도움이 됩니다.

SELECT Predict ([Association].[v Assoc Seq Line Items], INCLUDE_STATISTICS, 10)
FROM 
     [Association]
NATURAL PREDICTION JOIN
SELECT (SELECT 'Women''s Mountain Shorts' as [Model]) AS [v Assoc Seq Line Items]) AS t

[!참고]

이 예에서 입력으로 제공된 값에는 작은따옴표가 들어 있으므로 작은따옴표를 앞에 추가하여 이스케이프해야 합니다. 이스케이프 문자를 삽입하는 구문을 모르는 경우 예측 쿼리 작성기를 사용하여 쿼리를 만들 수 있습니다. 드롭다운 목록에서 값을 선택하면 필요한 이스케이프 문자가 자동으로 삽입됩니다. 자세한 내용은 데이터 마이닝 디자이너에서 단일 쿼리 작성을 참조하십시오.

예 결과:

Model	$SUPPORT	$PROBABILITY	$ADJUSTEDPROBABILITY
Sport-100	4334	0.291283016	0.252695851
Water Bottle	2866	0.192620472	0.175205052
Patch kit	2113	0.142012232	0.132389356
Mountain Tire Tube	1992	0.133879965	0.125304948
Mountain-200	1755	0.117951475	0.111260823
Road Tire Tube	1588	0.106727603	0.101229538
Cycling Cap	1473	0.098998589	0.094256014
Fender Set - Mountain	1415	0.095100477	0.090718432
Mountain Bottle Cage	1367	0.091874454	0.087780332
Road Bottle Cage	1195	0.080314537	0.077173962

TopCount 함수는 이 쿼리의 결과를 받아 지정된 수의 최소값 행을 반환합니다.

SELECT 
TopCount
    (
    Predict ([Association].[v Assoc Seq Line Items],INCLUDE_STATISTICS,10),
    $SUPPORT,
    3)
FROM 
     [Association]
NATURAL PREDICTION JOIN
(SELECT (SELECT 'Women''s Mountain Shorts' as [Model]) AS [v Assoc Seq Line Items]) AS t

TopCount 함수에 대한 첫 번째 인수는 테이블 열의 이름입니다. 이 예에서는 Predict 함수를 호출하고 INCLUDE_STATISTICS 인수를 사용하여 중첩 테이블을 반환합니다.

TopCount 함수에 대한 두 번째 인수는 중첩 테이블에서 결과를 정렬하는 데 사용할 열입니다. 이 예에서 INCLUDE_STATISTICS 옵션은 $SUPPORT, $PROBABILTY 및 $ADJUSTED PROBABILITY 열을 반환합니다. 이 예에서는 $SUPPORT를 사용하여 결과의 등급을 지정합니다.

TopCount 함수에 대한 세 번째 인수는 행 수를 정수로 반환하도록 지정합니다. $SUPPORT에서 정렬한 대로 최상위 3개 제품을 얻으려면 3을 입력합니다.

예 결과:

Model	$SUPPORT	$PROBABILITY	$ADJUSTEDPROBABILITY
Sport-100	4334	0.29…	0.25…
Water Bottle	2866	0.19…	0.17…
Patch kit	2113	0.14…	0.13…

그러나 이 유형의 쿼리는 프로덕션 설정의 성능에 영향을 미칠 수 있습니다. 이는 이 쿼리가 알고리즘의 모든 예측 집합을 반환하고, 이러한 예측을 정렬하며 최상위 3개를 반환하기 때문입니다.

다음 예에서는 동일한 결과를 반환하지만 매우 빠르게 실행되는 대체 문을 제공합니다. 이 예에서는 TopCount를 Predict 함수로 대체하며 이 함수는 많은 예측을 인수로 허용합니다. 또한 이 예에서는 $SUPPORT 키워드를 사용하여 중첩 테이블 열을 직접 검색합니다.

SELECT Predict ([Association].[v Assoc Seq Line Items], INCLUDE_STATISTICS, 3, $SUPPORT)

결과에는 지원 값으로 정렬된 최상위 3개 예측이 포함됩니다. $SUPPORT를 $PROBABILITY 또는 $ADJUSTED_PROBABILITY로 대체하여 확률 또는 조정된 확률로 등급이 지정된 예측을 반환할 수 있습니다. 자세한 내용은 Predict (DMX)를 참조하십시오.