你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure AI 搜索中的新增功能
Azure 认知搜索现已更名为 Azure AI 搜索。 了解 Azure AI 搜索的功能、文档和示例的最新更新。
注意
预览功能在此处公布,但我们还会维护预览功能列表,以便你可以在一个位置找到这些功能。
2024 年 12 月
Item | 类型 | 描述 |
---|---|---|
使用 Azure AI 搜索 + Python 进行 RAG 聊天 | 模板 | 用于使用 Azure AI 搜索和 Python 生成 RAG 解决方案的 AI 应用程序模板。 |
2024 年 11 月
Item | 类型 | 描述 |
---|---|---|
网络安全外围 | 安全性 | 将搜索服务加入网络安全外围,以控制对搜索服务的网络访问。 2024-06-01-preview 中的 Azure 门户和管理 REST API 可用于查看和协调网络安全外围配置。 |
Azure AI 服务连接的共享专用链接支持 | 安全性 | 用于内置技能处理的 Azure AI 连接现在可以使用连接上的共享专用链接进行专用。 |
压缩矢量的重新评分选项 | 相关性 | 可以设置选项,以使用原始矢量(而不是压缩矢量)重新评分。 适用于使用二进制和标量压缩的 HNSW 和详尽 KNN 矢量算法。 创建或更新索引 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。 |
存储较少的矢量实例 | 矢量搜索 | 在矢量压缩方案中,如果不需要全精度矢量进行重新评分,则可以省略其存储。 创建或更新索引 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。 |
在语义重排器中查询重写 | 相关性 | 可以在语义查询上设置选项,将查询输入重写为经过修订或扩展的查询,以便从 L2 排序器生成更相关的结果。 搜索文档 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。 |
新语义排序器模型 | 相关性 | 语义排序器在所有受支持的区域中与改进的模型一起运行。 API 或 Azure 门户体验没有更改。 |
文档布局技能 | 应用 AI(技能) | 用于分析文档结构的新技能,并提供结构感知(段落)分块。 此技能调用文档智能并使用文档智能布局模型。 在选定区域的创建或更新技能组 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。 |
Azure AI 技能处理的无密钥计费 | 应用 AI(技能) | 现在可以将托管标识和角色用于与 Azure AI 服务的无密钥连接,以便进行内置技能处理。 此功能消除了在同一区域中同时提供搜索和 AI 服务的限制。 创建或更新技能组 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。 |
Markdown 分析模式 | 索引器数据源 | 使用此分析模式,索引器可以从 Azure 存储和 OneLake 中的 Markdown 文件生成一对一或一对多的搜索文档。 创建或更新索引器 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。 |
2024-11-01-preview | API | 查询重写、文档布局技能、技能处理无密钥计费、Markdown 分析模式以及压缩矢量的重新评分选项的 REST API 预览版本。 |
门户对结构化数据的支持 | 功能 | “导入和矢量化数据”向导现支持 Azure SQL、Azure Cosmos DB 和 Azure 表存储。 |
2024 年 10 月
Item | 类型 | 描述 |
---|---|---|
降低 Azure OpenAI 上 MRL 训练的文本嵌入模型的维度要求 | 功能 | Text-embedding-3-small 和 Text-embedding-3-large 使用俄罗斯套娃表征学习 (MRL) 进行训练。 这样你就可以将嵌入矢量截成更少的维度,并调整矢量索引大小使用和检索质量之间的平衡。 2024-09-01-preview 中的新 truncationDimension 支持访问文本嵌入模型中的 MRL 压缩。 只能为新的矢量字段配置它。 |
解压缩 @search.score 以查看混合搜索结果中的子分数 |
功能 | 可以通过查看最终的合并和评分结果中的各个查询子分数来调查倒数排名融合 (RRF) 排名结果。 新的 debug 属性会解压缩搜索分数。 QueryResultDocumentSubscores 、QueryResultDocumentRerankerInput 和 QueryResultDocumentSemanticField 提供额外的详细信息。 2024-09-01-preview 中提供了这些定义。 |
将混合搜索中的目标筛选器限定为矢量查询 | 功能 | 混合查询的筛选器涉及请求的所有子查询,无论类型如何。 可以替代全局筛选器,以将筛选器范围限定为特定的子查询。 新的 filterOverride 参数可在使用 2024-09-01-preview 的混合查询中使用。 |
文本拆分技能(标记分块) | 应用 AI(技能) | 此技能具有新的参数,可改善嵌入模型的数据分块。 新的 unit 参数可让你指定标记分块。 现在可以按标记长度分块,将长度设置为对嵌入模型有意义的值。 还可以指定 tokenizer 和任何在数据分块期间不应拆分的标记。 新的 unit 参数和查询子分数定义可在 2024-09-01-preview 中找到。 |
2024-09-01-preview | API | 预览版 REST API,用于 text-embedding-3 模型中的已截断维度、混合查询的目标矢量筛选、对应于调试的 RRF 子分数详细信息,以及适用于文本拆分技能的标记分块。 |
客户管理的密钥 (CMK) 加密 (CMK) 的门户支持 | 功能 | 在 Azure 门户中创建新对象时,现在可以指定 CMK 加密并选择一个 Azure Key Vault 来提供密钥。 |
2024 年 8 月
Item | 类型 | 描述 |
---|---|---|
调试会话改进 | feature | 有两个重要改进。 首先,现在可以调试集成矢量化和数据分块工作负载。 其次,调试会话经过了重新设计,使技能和映射的呈现更简化。 可以选择流中的一个对象,在侧面板中查看或编辑其详细信息。 以前使用的选项卡式布局完全替换为页面上的更多上下文敏感信息。 |
2024-07-01 | API | REST API 的稳定版正式发布,支持矢量数据类型、矢量压缩以及在索引编制和查询期间的集成矢量化。 |
集成矢量化 | 功能 | 宣布正式发布。 在索引期间进行技能驱动的分块和嵌入。 |
矢量化器 | 功能 | 宣布正式发布。 在查询执行期间进行文本到矢量转换。 Azure OpenAI 矢量器和自定义 Web API 矢量器都已正式发布。 |
AzureOpenAIEmbedding 技能 | 功能 | 宣布正式发布。 一种技能类型,可在索引编制期间调用 Azure OpenAI 嵌入模型来生成嵌入项。 |
索引投影 | 功能 | 宣布正式发布。 技能组定义的一个组件,用于定义辅助索引的形状。支持一对多索引模式,其中,来自扩充管道的内容可以针对多个索引。 |
二进制和标量量化 | 功能 | 宣布正式发布。 使用内置量化压缩内存和磁盘上的矢量索引大小。 |
窄数据类型 | 功能 | 宣布正式发布。 假设传入的数据是该数据类型,在矢量字段上分配较小的数据类型。 |
导入和矢量化数据向导 | Azure 门户 | 宣布正式发布。 可创建包括数据分块和矢量化的完整索引管道的向导。 该向导可创建所有必要的对象和配置。 此版本添加了对 Azure 存储中的 Azure Data Lake 的向导支持。 |
存储的属性 | 功能 | 宣布正式发布。 布尔值,通过不存储可检索矢量来减少矢量索引的存储。 |
vectorQueries.Weight 属性 | 功能 | 宣布正式发布。 在搜索操作中指定每个矢量查询的相对权重。 |
2024 年 7 月
Item | 类型 | 描述 |
---|---|---|
与数据进行交互 | 加速器 | 在 Azure 中运行的 RAG 模式的解决方案加速器,使用 Azure AI 搜索进行检索,并使用 Azure OpenAI 大型语言模型来创建对话式搜索体验。 带有示例数据的代码可用于财务顾问、合同审查和汇总等用例场景。 |
对话知识挖掘 | 加速器 | 基于 Azure AI 搜索、Azure 语音和 Azure OpenAI 服务构建的解决方案加速器,允许客户从联系中心后的对话中提取可操作的见解。 |
生成你自己的 Copilot | 加速器 | 创建自己的自定义 Copilot 解决方案,使客户顾问能够在结构化和非结构化数据中利用生成 AI 的强大功能。 帮助客户优化日常任务,与更多客户建立更好的互动。 |
2024 年 6 月
Item | 类型 | 描述 |
---|---|---|
Azure 门户中的图像搜索 | 功能 | 搜索资源管理器现在支持图像搜索。 在具有矢量化图像内容的矢量索引中,可以将图像拖放到搜索资源管理器中以查询匹配项。 |
2024 年 5 月
Item | 类型 | 描述 |
---|---|---|
每个层更高的容量和更多的矢量配额(相同的计费费率) | 基础结构 | 对于大多数区域,2024 年 4 月 3 日之后创建的服务的标准 2 (S2)、标准 3 (S3) 和标准 3 高密度 (S3 HD) 现在可以使用更大的分区大小。 要获取更大的分区,请在提供较新的基础结构的区域中创建新服务。 存储优化层(L1 和 L2)也有了更多容量。 L1 和 L2 客户必须创建新的服务,才能受益于更高的容量。 目前未提供就地升级。 额外容量现已在更多区域提供:德国北部、德国中西部、南非北部、瑞士西部以及 Azure 政府(得克萨斯州、亚利桑那州和弗吉尼亚州)。 |
OneLake 集成(预览版) | 功能 | OneLake 文件和 OneLake 快捷方式的新索引器。 如果使用 Microsoft Fabric 和 OneLake 对 Amazon Web Services (AWS) 和 Google 数据源进行数据访问,请使用此索引器将外部数据导入到搜索索引中。 此索引器可通过 Azure 门户、2024-05-01-preview REST API 和 Azure SDK beta 包获取。 |
矢量相关性 混合查询相关性 |
功能 | 四项增强功能可提高矢量和混合搜索相关性。 首先,现在可以对矢量搜索结果设置阈值,排除低评分结果。 其次,查询体系结构中的更改在每个查询类型的查询管道末尾应用计分配置文件。 文档提升是一个常见的计分概要文件,现在它在矢量和混合查询上按预期工作。 第三,可以在混合查询中设置 MaxTextRecallSize 和 countAndFacetMode ,以控制流入混合排名模型的 BM25 排名搜索结果的数量。 第四,对于矢量和混合搜索,可以加权矢量查询,以便在多查询请求中提升或降低其重要性。 |
二进制矢量支持 | 功能 | Collection(Edm.Byte) 是新的受支持的数据类型。 此数据类型将打开与 Cohere v3 二进制嵌入模型 和自定义二进制量化的集成。 缩小数据类型可降低大型矢量数据集的成本。 有关详细信息,请参阅编制二进制数据索引以进行矢量搜索。 |
Azure AI 视觉多模式嵌入技能(预览版) | 技能 | 绑定到 Azure AI 视觉的多模式嵌入 API 的新技能。 可以在编制索引期间为文本或图像生成嵌入。 此技能可通过 Azure 门户和 2024-05-01 预览版 REST API 获取。 |
Azure AI 视觉矢量化器(预览版) | 矢量化器 | 新的矢量化器使用 多模式嵌入 API 连接到 Azure AI 视觉资源,以在查询时生成嵌入。 此矢量化器可通过 Azure 门户和 2024-05-01 预览版 REST API 获取。 |
Azure AI Foundry 模型目录矢量化器(预览版) | 矢量化器 | 新的矢量化器可连接到从 Azure AI Foundry 模型目录部署的嵌入模型。 此矢量化器可通过 Azure 门户和 2024-05-01 预览版 REST API 获取。 如何使用 Azure AI Foundry 中的模型实现集成的矢量化。 |
AzureOpenAIEmbedding 技能(预览版)支持 Azure OpenAI 上的更多模型 | 技能 | 现在支持 text-embedding-3-large 和 text-embedding-3-small,以及上一次更新中的 text-embedding-ada-002。 通过新的 dimensions 和 modelName 属性,可以在 Azure OpenAI 上指定各种嵌入模型。 以前,维度限制固定在 1,536 个维度,仅适用于 text-embedding-ada-002。 更新的技能可通过 Azure 门户和 2024-05-01-preview REST API 获取。 |
Azure 门户更新 | 门户 | 导入和向量化数据向导现在支持将 OneLake 索引器作为数据源。 对于嵌入,它还支持连接到 Azure AI 视觉多模式、Azure AI Foundry 模型目录,以及 Azure OpenAI 上的其他嵌入模型。 将字段添加到索引时,可以选择二进制数据类型。 搜索资源管理器现在默认为 2024-05-01-preview,并支持向量和混合查询的新预览功能。 |
2024-05-01-preview | API | 搜索 REST API 的新预览版提供了新的技能和矢量化器、新的二进制数据类型、OneLake 文件索引器、用于获取更相关结果的新查询参数。 如果已有针对 2023-07-01-preview 编写的代码,并且需要迁移到此版本,请参阅升级 REST API。 |
Azure SDK beta 版包 | API | 查看以下 Azure SDK beta 版包的更改日志,以获取新功能支持:适用于 Python 的 Azure SDK、适用于 .NET 的 Azure SDK、适用于 Java 的 Azure SDK |
Python 代码示例 | 示例 | 新的端到端示例演示了与 Cohere Embed v3 的集成、与 OneLake 以及 Google 和 AWS 上的云数据平台的集成以及与 Azure AI Vision 多模式 API 的集成。 |
2024 年 4 月
Item | 类型 | 描述 |
---|---|---|
解决信息泄露问题的安全更新 | API | GET 响应不再返回连接字符串或密钥。 适用于 GET 技能组、GET 索引和 GET 索引器。 此更改有助于保护与 AI 搜索集成的 Azure 资产免受未经授权的访问。 |
基本层和标准层上的更多存储 | 基础结构 | 基本层现在最多支持三个分区和三个副本。 基本层和标准层 (S1, S2, S3) 每个分区的存储量明显增加,每个分区的计费费率相同。 额外的容量受区域可用性影响,适用于 2024 年 4 月 3 日之后新建的搜索服务。 目前没有就地升级,因此必须创建新的搜索服务才能获取额外的存储。 |
矢量的更多配额 | 基础结构 | 在所选区域 2024 年 4 月 3 日之后新建的服务上,矢量配额也更高。 |
矢量量化、窄矢量数据类型和新的 stored 属性(预览) |
功能 | 这三个功能共同增加了矢量压缩和更智能的存储选项。 第一,标量量化减少了内存和磁盘上的矢量索引大小。 其次,窄数据类型将通过存储较小的值来减少每字段存储。 第三,可以使用 stored 来选择不存储仅用于搜索结果的额外矢量副本。 如果查询响应中不需要矢量,可以将 stored 设置为 false 以节省空间。 |
2024-03-01-preview 搜索 REST API | API | 新数据类型、矢量压缩属性和矢量存储选项的搜索 REST API 的新预览版。 |
2024-03-01-preview 管理 REST API | API | 用于控制平面操作的全新预览版管理 REST API。 |
2023-07-01-preview 弃用公告 | API | 在 2024 年 4 月 8 日宣布了弃用。 它将从 2024 年 7 月 8 日开始不再受支持。 这是提供了矢量搜索支持的第一个 REST API。 较新的 API 版本具有不同的矢量配置。 请尽快迁移到较新版本。 |
2024 年 2 月
Item | 类型 | 描述 |
---|---|---|
新的维度限制 | 功能 | 对于矢量字段,维度上限现在从 2048 增加到 3072 。 |
2023 年公告
月 | 类型 | 公告 |
---|---|---|
11 月 | 功能 | 矢量搜索,正式发布。 之前对客户管理的密钥 (CMK) 的限制现已取消。 预筛选和穷举 K 最近的邻域算法现在也已正式发布。 |
11 月 | 功能 | 语义排序器,正式发布 |
11 月 | 功能 | 集成矢量化(预览版)在索引编制期间添加数据分块和文本到矢量的转换,并在查询时添加文本到矢量的转换。 |
11 月 | 功能 | 导入和矢量化数据向导(预览版)自动执行数据分块和矢量化。 它面向 2023-10-01-Preview REST API。 |
11 月 | 功能 | 索引投影(预览版)定义辅助索引的形状,用于一对多索引模式,其中扩充管道中的内容可以面向多个索引。 |
11 月 | API | 2023-11-01 搜索 REST API 是用于矢量搜索和语义排名的搜索 REST API 的稳定版本。 有关迁移到正式版功能的迁移步骤,请参阅REST API 升级。 |
11 月 | API | 2023-11-01 管理 REST API 添加了可启用或禁用语义排序器的 API。 |
11 月 | 技能 | Azure OpenAI 嵌入技能(预览版)连接到 Azure OpenAI 资源上部署的嵌入模型,以在技能集执行期间生成嵌入。 |
11 月 | 技能 | 文本拆分技能(预览版)在 2023-10-01-Preview 中更新,以支持本机数据分块。 |
11 月 | 视频 | 矢量搜索和语义排名如何改善 GPT 提示说明混合检索如何为你提供最佳定位数据,以生成有用的 AI 响应,并启用对概念和关键字的搜索。 |
11 月 | 示例 | 生成式 AI 应用程序中基于角色的访问控制介绍如何使用 Microsoft Entra ID 和 Microsoft Graph API 对索引中分块内容实施精细的用户权限。 |
10 月 | 示例 | “与数据聊天”解决方案加速器。 使用 Azure AI 搜索作为检索器的端到端 RAG 模式。 它提供索引、数据分块和业务流程。 |
10 月 | 功能 | 用于矢量空间中相似搜索的详尽 K-近邻 (KNN) 评分算法。 仅在 2023-10-01-Preview REST API 中可用。 |
10 月 | 功能 | 矢量搜索中的预筛选器在查询执行之前评估筛选条件,从而减少需要搜索的内容量。 仅在 2023-10-01-Preview REST API 中可用,其方法是通过查询上可设置为 preFilter (默认值)或 postFilter 的新 vectorFilterMode 属性来实现,具体取决于你的要求。 |
10 月 | API | 2023-10-01-Preview 搜索 REST API 中断了矢量字段和矢量查询的定义。 |
8 月 | 功能 | 增强语义排名。 用于语义重排的升级模型正在推出,可用性将扩展到更多区域。 最大唯一令牌数从 128 翻倍到 256。 |
7 月 | 示例 | 矢量演示(适用于 JavaScript 的 Azure SDK)。 使用 Node.js 和 @azure/search-documents 12.0.0-beta.2 库生成嵌入、创建和加载索引,以及运行多个矢量查询。 |
7 月 | 示例 | 矢量演示(适用于 .NET 的 Azure SDK)。 使用 Azure.Search.Documents 11.5.0-beta.3 库生成嵌入、创建和加载索引,以及运行多个矢量查询。 还可以从 Azure SDK 团队试用此示例。 |
7 月 | 示例 | 矢量演示(适用于 Python 的 Azure SDK)使用 azure.search.documents 的最新 beta 版本生成嵌入、创建和加载索引,以及运行多个矢量查询。 有关更多矢量搜索演示,请访问 azure-search-vector-samples/demo-python 存储库。 |
6 月 | 功能 | 矢量搜索公共预览版。 |
6 月 | 功能 | 基本层上提供的语义搜索可用性。 |
6 月 | API | 2023-07-01-preview 搜索 REST API。 支持矢量搜索。 |
5 月 | 功能 | Azure RBAC(基于角色的访问控制,正式发布)。 |
5 月 | API | 2022-09-01 管理 REST API,支持配置搜索以使用 Azure 角色。 Azure PowerShell 的 Az.Search 模块和 Azure CLI 的 Az.search 模块已更新为支持搜索服务身份验证选项。 也可以使用 Terraform 提供程序配置身份验证选项(有关详细信息,请参阅此 Terraform 快速入门)。 |
4 月 | 示例 | 多区域部署 Azure AI 搜索,实现业务连续性和灾难恢复。 部署脚本,可为 Azure AI 搜索完整地配置多区域解决方案,并提供在终结点失败时同步内容和请求重定向的选项。 |
3 月 | 示例 | ChatGPT + Enterprise 数据以及 Azure OpenAI 和 Azure AI 搜索 (GitHub)。 用于将 Azure AI 搜索与 OpenAI 中的大型语言模型相结合的 Python 代码以及模板。 有关背景信息,请参阅此技术社区博客文章:使用 ChatGPT 彻底改变企业数据。 要点: 使用 Azure AI 搜索来整合可搜索内容并为其编制索引。 查询初始搜索结果的索引。 收集来自这些结果的提示,并将其发送到 Azure OpenAI 中的 gpt-35-turbo(预览版)模型。 返回跨文档答案,并在面向客户的应用中提供引文和透明度,以便用户可以评估该响应。 |
上一年的公告
服务品牌重塑
多年来,此服务有多个名称。 此处为逆时序顺序排列这些名称:
- Azure AI 搜索(2023 年 11 月)已重命名,以符合 Azure AI 服务和客户预期。
- Azure 认知搜索(2019 年 10 月)已重命名,以反映认知技能和 AI 处理在服务操作中更广泛的用途(但仍为可选)。
- Azure 搜索(2015 年 3 月)原始名称。
服务更新
在 Azure 网站上可以找到 Azure AI 搜索的服务更新通告。
功能重命名
2023 年 11 月,语义搜索已更名为语义排序器,以更好地描述现有结果集 L2 排序的功能。