Compartilhar via


Busca em vetores no Azure Cosmos DB

A pesquisa vetorial é um método que ajuda a localizar itens semelhantes com base em suas características de dados, em vez de correspondências exatas em um campo de propriedade. Essa técnica é útil em usos como pesquisa de texto semelhante, localização de imagens relacionadas, recomendações ou até mesmo detecção de anomalias. Ele funciona usando as inserções de vetor de seus dados e consulta e, em seguida, medindo a distância entre os vetores de dados e o vetor de consulta. Os vetores de dados mais próximos do vetor de consulta são os mais semelhantes semanticamente.

Exemplos

Essa visualização interativa mostra alguns exemplos de proximidade e distância entre vetores.

Algoritmos

Dois tipos principais de algoritmos de busca em vetores são kNN (k vizinhos mais próximos) e ANN (vizinho mais próximo aproximado). Entre kNN e ANN, este último oferece um equilíbrio entre precisão e eficiência, tornando-o mais adequado para aplicativos em grande escala. Alguns algoritmos ANN conhecidos incluem FIV (Arquivo Invertido), HNSW (Hierarchical Navigable Small World) e DiskANN de última geração.

O uso de um recurso de busca em vetores integrado em um banco de dados com todos os recursos (em oposição a um banco de dados vetorial puro) oferece uma maneira eficiente de armazenar, indexar e pesquisar dados de vetor de alta dimensão diretamente ao lado de outros dados do aplicativo. Essa abordagem elimina a necessidade de migrar seus dados para bancos de dados vetoriais alternativos mais caros e oferece uma integração perfeita dos seus aplicativos orientados por IA.