ClusterDistance (DMX)

[アーティクル]
01/02/2025

適用対象: SQL Server Analysis Services

ClusterDistance 関数は、指定されたクラスターからの入力ケースの距離、またはクラスターが指定されていない場合は、最も可能性の高いクラスターからの入力ケースの距離を返します。

構文

  
ClusterDistance([<ClusterID expression>])

適用対象

この関数は、基になるデータマイニングモデルがクラスタリングをサポートしている場合にのみ使用できます。この関数は任意の種類のクラスタリングモデル (EM、K-Means など) で使用できますが、結果はアルゴリズムによって異なります。

返り値の種類

スカラー値。

解説

ClusterDistance 関数は、入力ケースと、その入力ケースの最も高い確率を持つクラスターとの間の距離を返します。

K-Means クラスタリングの場合、いずれの場合も 1 つのクラスターにのみ属できるため、メンバーシップの重みは 1.0 で、クラスターの距離は常に 0 になります。ただし、K-Means では、各クラスターに重心があると想定されています。重心の値は、マイニングモデルコンテンツ内の入れ子になったNODE_DISTRIBUTIONテーブルに対してクエリを実行または参照することで取得できます。詳細については、「クラスタリングモデルのモデルコンテンツの作成 (Analysis Services - データマイニング)」を参照してください。

既定の EM クラスタリング方式の場合、クラスター内のすべてのポイントが同じように考えられます。したがって、設計上、クラスターの重心はありません。特定のケースと特定のクラスター N の間のClusterDistanceの値は次のように計算されます。

ClusterDistance(N) =1-(membershipWeight(N))

または:

ClusterDistance(N) =1-ClusterProbability (N))

Analysis Services には、クラスタリングモデルに対してクエリを実行するための次の追加関数が用意されています。

最も可能性の高いクラスターを返すには、クラスター (DMX) 関数を使用します。
ClusterProbability (DMX)関数を使用して、ケースが特定のクラスターに属している確率を取得します。この値は、クラスター距離の逆関数として機能します。
PredictHistogram (DMX)関数を使用して、各モデルのクラスターに存在する入力ケースの可能性のヒストグラムを返します。
PredictCaseLikelihood (DMX)関数を使用して、アルゴリズムによって学習されたモデルを考慮して入力ケースが存在する可能性を示す 0 から 1 までのメジャーを返します。

例 1: 最も可能性の高いクラスターまでのクラスター距離の取得

次の例では、指定したケースから、ケースが属している可能性が最も高いクラスターまでの距離を返します。

SELECT  
    ClusterDistance()  
FROM  
    [TM Clustering]  
NATURAL PREDICTION JOIN  
(SELECT 28 AS [Age],  
    '2-5 Miles' AS [Commute Distance],  
    'Graduate Degree' AS [Education],  
    0 AS [Number Cars Owned],  
    0 AS [Number Children At Home]) AS t

結果の例:

Expression
0.0477390930705145

これがどのクラスターであるかを確認するには、上記の例で Cluster の代わりに ClusterDistance を使用します。

結果の例:

$CLUSTER
クラスター 6

例 2: 指定したクラスターまでの距離の取得

次の構文では、マイニングモデルコンテンツスキーマ行セットを使用して、マイニングモデル内のクラスターのノードの ID とノードのキャプションの一覧を返します。その後、 ClusterDistance 関数のクラスター識別子引数としてノードキャプションを使用できます。

SELECT NODE_UNIQUE_NAME, NODE_CAPTION   
FROM <model>.CONTENT   
WHERE NODE_TYPE = 5

結果の例:

NODE_UNIQUE_NAME	NODE_CAPTION
001	クラスター 1
002	Cluster 2

次の構文例は、クラスター 2 というラベルのクラスターから指定されたケースの距離を返します。

SELECT  
    ClusterDistance('Cluster 2')  
AS [Cluster 2 Distance]  
FROM [TM Clustering]  
NATURAL PREDICTION JOIN  
(SELECT 28 AS [Age],  
    '2-5 Miles' AS [Commute Distance],  
    'Graduate Degree' AS [Education],  
    0 AS [Number Cars Owned],  
    0 AS [Number Children At Home]) AS t

結果の例:

Cluster 2 Distance
0.97008209236394

参照

クラスター (DMX)
データマイニング拡張機能 (DMX) 関数リファレンス
 関数 (DMX)
クラスタリングモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)

次の方法で共有

ClusterDistance (DMX)

構文

適用対象

返り値の種類

解説

例 1: 最も可能性の高いクラスターまでのクラスター距離の取得

例 2: 指定したクラスターまでの距離の取得

参照

フィードバック

その他のリソース

次の方法で共有

ClusterDistance (DMX)

構文

適用対象

返り値の種類

解説

関連する予測関数

例 1: 最も可能性の高いクラスターまでのクラスター距離の取得

例 2: 指定したクラスターまでの距離の取得

参照

フィードバック

その他のリソース