次の方法で共有


Distance 関数とは

Distance 関数は、ベクトル間の類似性または非類似度を測定するために使用される数式です (ベクトル検索を参照)。 一般的な例としては、マンハッタン距離、ユークリッド距離、コサイン類似度、ドット積などがあります。 これらの測定値は、2 つのデータがどの程度密接に関連しているかを判断するために重要です。

マンハッタン距離

これは、座標の絶対差を加算することによって、2 つの点間の距離を測定します。 マンハッタンの多くの地区など、碁盤目状の都市を歩いているとします。これは、南北と東西を歩くブロックの合計数です。

ユークリッド距離

ユークリッド距離は、2 点間の直線距離を測定します。 これは古代の数学者ユークリッドにちなんだ名前です。ユークリッドはしばしば "幾何学の父" と呼ばれています。

コサイン類似度

コサイン類似度は、多次元空間に投影された 2 つのベクトル間の角度のコサインを測定するものです。 2 つのドキュメントは、ユークリッド距離で離れている場合があります。しかし、2 つのドキュメントの角度はまだ小さく、したがってコサイン似度が高い可能性があります。

ドット積

2 つのベクトルが乗算され、1 つの数値が返されます。 2 つのベクトルの大きさと、それらの間の角度のコサインを組み合わせて、1 つのベクトルが別のベクトルの方向にどれだけ進むかを示します。