O que são as funções de distância?
As funções de distância são fórmulas matemáticas usadas para medir a similaridade ou a diferença entre os vetores (consulte busca em de vetores). Exemplos comuns incluem a distância de Manhattan, distância euclidiana, similaridade de cosseno e produto escalar. Essas medidas são cruciais para determinar a proximidade entre dois dados.
Distância de Manhattan
Isso mede a distância entre dois pontos somando as diferenças absolutas das suas coordenadas. Imagine andar em uma cidade em forma de grade, como muitos bairros de Manhattan; é o número total de quarteirões que você anda no sentido norte-sul e leste-oeste.
Distância euclidiana
A distância euclidiana mede a distância em linha reta entre dois pontos. Seu nome é uma homenagem ao antigo matemático Euclides, que é frequentemente chamado de “pai da geometria”.
Similaridade de cosseno
A similaridade do cosseno mede o cosseno do ângulo entre dois vetores projetados em um espaço multidimensional. Dois documentos podem estar distantes pela distância euclidiana devido ao tamanho dos documentos, mas ainda assim podem ter um ângulo menor entre eles e, portanto, alta similaridade de cosseno.
Produto de Ponto
Dois vetores são multiplicados para retornar um único número. Ele combina as magnitudes dos dois vetores e o cosseno do ângulo entre eles, mostrando o quanto um vetor vai na direção do outro.
Conteúdo relacionado
- Função do sistema VectorDistance no NoSQL do Azure Cosmos DB
- O que é um banco de dados vetorial?
- Geração Aumentada de Recuperação (RAG)
- Banco de dados vetorial no Azure Cosmos DB para NoSQL
- Banco de dados vetorial no Azure Cosmos DB for MongoDB
- O que é a busca em vetores?
- Tokens de LLM
- Inserções de vetor
- Algoritmos de busca em vetores kNN vs ANN