Co jsou funkce vzdálenosti?
Funkce vzdálenosti jsou matematické vzorce používané k měření podobnosti nebo odlišnosti mezi vektory (viz vektorové vyhledávání). Mezi běžné příklady patří manhattanská vzdálenost, euklidská vzdálenost, kosinus podobnost a tečkovaný produkt. Tato měření jsou zásadní pro určení toho, jak úzce souvisí dva části dat.
Manhattan vzdálenost
Tím se měří vzdálenost mezi dvěma body tak, že sečtou absolutní rozdíly jejich souřadnic. Představte si procházku ve městě podobném mřížce, jako je mnoho čtvrtí na Manhattanu; je to celkový počet bloků, které procházíte sever-jih a východ-západ.
Euklidská vzdálenost
Euklidská vzdálenost měří přímočarou vzdálenost mezi dvěma body. Jmenuje se po starém matematikovi Euklidovi, který se často označuje jako "otec geometrie".
Kosinusová podobnost
Kosinus podobnost měří kosinus úhlu mezi dvěma vektory promítanými v multidimenzionálním prostoru. Vzhledem k velikosti dokumentů mohou být dva dokumenty daleko od euklidovské vzdálenosti, ale stále mohou mít menší úhel mezi nimi a proto vysokou kosinusovou podobností.
Skalární součin
Dva vektory se vynásobí tak, aby vrátily jedno číslo. Kombinuje velikost dvou vektorů a kosinus úhlu mezi nimi, který ukazuje, kolik jednoho vektoru jde ve směru druhého.
Související obsah
- Funkce systému VectorDistance ve službě Azure Cosmos DB NoSQL
- Co je vektorová databáze?
- Načítání rozšířené generace (RAG)
- Vektorová databáze ve službě Azure Cosmos DB NoSQL
- Vektorová databáze ve službě Azure Cosmos DB pro MongoDB
- Co je vektorové vyhledávání?
- Tokeny LLM
- Vektorové vkládání
- kNN vs ANN vector search algorithms