Sdílet prostřednictvím


Vektorové vyhledávání ve službě Azure Cosmos DB

Vektorové vyhledávání je metoda, která vám pomůže najít podobné položky na základě jejich charakteristik dat, nikoli přesných shod v poli vlastnosti. Tato technika je užitečná v aplikacích, jako je hledání podobného textu, hledání souvisejících obrázků, vytváření doporučení nebo dokonce zjišťování anomálií. Funguje tak, že vezme vektorové vkládání dat a dotazu a pak změří vzdálenost mezi datovými vektory a vektorem dotazu. Datové vektory, které jsou nejblíže vašemu vektoru dotazu, jsou ty, které jsou nalezeny nejvíce podobné sémanticky.

Příklady

Tato interaktivní vizualizace ukazuje několik příkladů blízkosti a vzdálenosti mezi vektory.

Algoritmy

Dva hlavní typy algoritmů vektorového vyhledávání jsou k-nejbližší sousedé (kNN) a přibližný nejbližší soused (ANN). Mezi kNN a ANN nabízí druhá možnost rovnováhu mezi přesností a efektivitou, aby byla vhodnější pro rozsáhlé aplikace. Mezi dobře známé algoritmy ANN patří Inverted File (IVF), Hierarchical Navigable Small World (HNSW) a state-of-the-art DiskANN.

Použití funkce integrovaného vektorového vyhledávání v plně doporučené databázi (na rozdíl od čistě vektorové databáze) nabízí efektivní způsob, jak ukládat, indexovat a prohledávat vysoce dimenzionální vektorová data přímo vedle jiných aplikačních dat. Tento přístup eliminuje nutnost migrace dat do nákladných alternativních vektorových databází a poskytuje bezproblémovou integraci aplikací řízených AI.