什麼是距離函式?
距離函式是數學公式,用來測量向量之間的相似性或相異性 (請參閱向量搜尋)。 常見範例包括曼哈頓距離、歐幾里德距離、餘弦相似性和點乘積。 這些度量對於判斷兩個資料片段的關聯程度至關重要。
曼哈頓距離
這會藉由加總座標的絕對差值來測量兩點之間的距離。 想像一下,在一個類似網格的城市裡行走,比如曼哈頓的許多街區:這是你走南北和東西方的總區塊數。
歐幾里得距離
歐幾里德距離則會測量兩點之間的直線距離。 它以古代數學家尤克利德的名字命名,他經常被稱為“幾何之父”。
餘弦相似性
餘弦相似性測量在多維度空間中投影的兩個向量之間的餘弦值。 兩份文件因文件大小,再歐幾里得距離上可能相距很遠,但兩者間的夾角仍可能較小,因而產生頗高的餘弦相似性。
點乘積
兩個向量相乘後傳回單一數字。 它會結合兩個向量的大小,以及它們之間角度的餘弦值,顯示一個向量向另一個向量的方向。
相關內容
- Azure Cosmos DB NoSQL 中的 VectorDistance 系統函式
- 什麼是向量資料庫?
- 擷取擴增產生 (RAG)
- Azure Cosmos DB NoSQL 中的向量資料庫
- Azure Cosmos DB for MongoDB 中的向量資料庫
- 什麼是向量搜尋?
- LLM 權杖
- 向量內嵌
- kNN 與 ANN 向量搜尋演算法