Vektorové vyhledávání ve službě Azure Cosmos DB
Vektorové vyhledávání je metoda, která vám pomůže najít podobné položky na základě jejich charakteristik dat, nikoli přesných shod v poli vlastnosti. Tato technika je užitečná v aplikacích, jako je hledání podobného textu, hledání souvisejících obrázků, vytváření doporučení nebo dokonce zjišťování anomálií. Funguje tak, že vezme vektorové vkládání dat a dotazu a pak změří vzdálenost mezi datovými vektory a vektorem dotazu. Datové vektory, které jsou nejblíže vašemu vektoru dotazu, jsou ty, které jsou nalezeny nejvíce podobné sémanticky.
Příklady
Tato interaktivní vizualizace ukazuje několik příkladů blízkosti a vzdálenosti mezi vektory.
Algoritmy
Dva hlavní typy algoritmů vektorového vyhledávání jsou k-nejbližší sousedé (kNN) a přibližný nejbližší soused (ANN). Mezi kNN a ANN nabízí druhá možnost rovnováhu mezi přesností a efektivitou, aby byla vhodnější pro rozsáhlé aplikace. Mezi dobře známé algoritmy ANN patří Inverted File (IVF), Hierarchical Navigable Small World (HNSW) a state-of-the-art DiskANN.
Použití funkce integrovaného vektorového vyhledávání v plně doporučené databázi (na rozdíl od čistě vektorové databáze) nabízí efektivní způsob, jak ukládat, indexovat a prohledávat vysoce dimenzionální vektorová data přímo vedle jiných aplikačních dat. Tento přístup eliminuje nutnost migrace dat do nákladných alternativních vektorových databází a poskytuje bezproblémovou integraci aplikací řízených AI.
Související obsah
- Co je vektorová databáze?
- Načítání rozšířené generace (RAG)
- Vektorová databáze ve službě Azure Cosmos DB NoSQL
- Vektorová databáze ve službě Azure Cosmos DB pro MongoDB
- Tokeny LLM
- Vektorové vkládání
- Funkce vzdálenosti
- kNN vs ANN vector search algorithms
- Víceklientská architektura pro vektorové vyhledávání