你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure Cosmos DB 中的矢量搜索

借助矢量搜索,可根据数据特征而不是属性字段上的精确匹配项来查找相似的项。 这种方法在搜索相似文本、查找相关图像、提出建议甚至是检测异常等应用中很有用。 它的工作原理是矢量嵌入数据与查询,然后测量数据向量与查询向量之间的距离。 最接近查询矢量的数据矢量是在语义上最相似的数据矢量。

示例

交互式可视化显示了矢量之间的一些接近和距离示例。

算法

两种主要类型的矢量搜索算法是 k-最近的邻居 (kNN) 和近似最近的邻居 (ANN)。 在 kNN 和 ANN 之间,后者在准确性和效率之间提供了平衡,使其更适合大规模应用程序。 一些著名的 ANN 算法包括倒排文件(IVF)、分层导航小型世界 (HNSW) 和最先进的 DiskANN。

在功能齐全的数据库中使用集成矢量搜索功能(而不是纯矢量数据库)提供了一种与其他应用程序数据直接一起存储、索引和搜索高维向量数据的有效方法。 此方法消除了将数据迁移到更昂贵的替代矢量数据库的必要性,并提供 AI 驱动的应用程序的无缝集成。