你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

如何使用 Azure AI 搜索生成 RAG 解决方案

项目
11/11/2024

本教程系列演示了在 Azure AI 搜索上生成 RAG 解决方案的模式。它涵盖了 Azure AI 搜索中内置的组件、依赖项以及优化措施，以最大限度地提高相关性并降低成本。

示例数据是上传到 Azure 存储的 PDF 的集合。本内容来自美国国家航空航天局提供的关于地球的免费电子书。

可以在此 Python 笔记本中找到示例代码，但我们建议将此系列中的文章用于上下文、见解和探索替代方法。

本系列中的练习

选择用于嵌入和聊天的模型
设计对话搜索的索引
设计加载、区块、嵌入和引入可搜索内容的索引管道
使用查询和聊天模型检索可搜索内容
最大化相关性
最大程度地减少存储和成本

我们省略了 RAG 模式的几个方面，以减少复杂性：

没有聊天历史记录和上下文的管理。聊天历史记录通常与地面数据分开存储和管理，这意味着额外的步骤和代码。本教程假设向 LLM 提出的的问题及其提供的答案是原子式的且本教程内容基于 LLM 的默认体验。
对结果不提供每用户用户安全性（我们称之为“安全修整”）。有关详细信息和资源，请从安全修整开始，并确保查看文章末尾的链接。

本系列介绍 RAG 解决方案开发的基础知识。了解基础知识后，请继续学习加速器和其他代码示例，这些示例提供更多抽象，或者更适合生产环境和更复杂的工作负载。

为何使用适用于 RAG 的 Azure AI 搜索？

聊天模型面临可以在请求中接受的数据量的约束。应使用 Azure AI 搜索，因为传递给 LLM 的内容质量可以生成或破坏 RAG 解决方案。

为了向聊天模型提供高质量的输入，Azure AI 搜索提供了具有 AI 集成和全面相关性优化的最佳搜索引擎。搜索引擎支持矢量相似性搜索（多个算法）、关键字搜索、模糊搜索、地理空间搜索和筛选器。可以生成包含所有这些组件的混合查询请求，并且可以控制每个查询对整体请求的贡献量。

下一步