Busca em vetores no Azure Cosmos DB
A pesquisa vetorial é um método que ajuda a localizar itens semelhantes com base em suas características de dados, em vez de correspondências exatas em um campo de propriedade. Essa técnica é útil em usos como pesquisa de texto semelhante, localização de imagens relacionadas, recomendações ou até mesmo detecção de anomalias. Ele funciona usando as inserções de vetor de seus dados e consulta e, em seguida, medindo a distância entre os vetores de dados e o vetor de consulta. Os vetores de dados mais próximos do vetor de consulta são os mais semelhantes semanticamente.
Exemplos
Essa visualização interativa mostra alguns exemplos de proximidade e distância entre vetores.
Algoritmos
Dois tipos principais de algoritmos de busca em vetores são kNN (k vizinhos mais próximos) e ANN (vizinho mais próximo aproximado). Entre kNN e ANN, este último oferece um equilíbrio entre precisão e eficiência, tornando-o mais adequado para aplicativos em grande escala. Alguns algoritmos ANN conhecidos incluem FIV (Arquivo Invertido), HNSW (Hierarchical Navigable Small World) e DiskANN de última geração.
O uso de um recurso de busca em vetores integrado em um banco de dados com todos os recursos (em oposição a um banco de dados vetorial puro) oferece uma maneira eficiente de armazenar, indexar e pesquisar dados de vetor de alta dimensão diretamente ao lado de outros dados do aplicativo. Essa abordagem elimina a necessidade de migrar seus dados para bancos de dados vetoriais alternativos mais caros e oferece uma integração perfeita dos seus aplicativos orientados por IA.
Conteúdo relacionado
- O que é um banco de dados vetorial?
- Geração Aumentada de Recuperação (RAG)
- Banco de dados vetorial no Azure Cosmos DB para NoSQL
- Banco de dados vetorial no Azure Cosmos DB for MongoDB
- Tokens LLM
- Inserções de vetor
- Funções de distância
- Algoritmos de busca em vetores kNN vs ANN
- Multilocatário para Busca em Vetores