¿Qué son las funciones de distancia?
Las funciones de distancia son fórmulas matemáticas que se usan para medir la similitud o la diferencia entre vectores (consulte vector de búsqueda). Entre los ejemplos comunes se incluyen la distancia de Manhattan, la distancia euclidiana, la similitud de coseno y el producto de puntos. Estas medidas son cruciales para determinar el grado de parentesco entre dos datos.
Distancia de Manhattan
Esto mide la distancia entre dos puntos agregando las diferencias absolutas de sus coordenadas. Imagine caminar en una ciudad similar a una cuadrícula, como muchos vecindarios en Manhattan; es el número total de bloques que se caminan al norte-sur y al este-oeste.
Distancia euclidiana
La distancia euclidiana mide la distancia de línea recta entre dos puntos. Se llama así por el antiguo matemático Euclides, al que a menudo se conoce como el "padre de la geometría".
Similitud coseno
La similitud coseno mide el coseno del ángulo entre dos vectores proyectados en un espacio multidimensional. Dos documentos pueden estar muy separados por la distancia euclidiana debido a los tamaños de documento, pero todavía podrían tener un ángulo más pequeño entre ellos y, por lo tanto, una similitud de coseno alta.
Producto escalar
Se multiplican dos vectores para devolver un único número. Combina las magnitudes de los dos vectores, así como el coseno del ángulo entre ellos, mostrando cuánto va un vector en la dirección de otro.
Contenido relacionado
- Función del sistema VectorDistance en Azure Cosmos DB NoSQL
- ¿Qué es una base de datos vectorial?
- Generación aumentada de recuperación (RAG)
- Base de datos vectorial en Azure Cosmos DB NoSQL
- Base de datos vectorial en Azure Cosmos DB for MongoDB
- ¿Qué es la búsqueda vectorial?
- Tokens de LLM
- Inserciones vectoriales
- Algoritmos de vector de búsqueda de kNN frente a ANN