了解如何建立语言模型基础

已完成

语言模型擅长生成引人入胜的文本,非常适合用作 copilot 的基础。 Copilot 为用户提供了一个直观的基于聊天的应用程序,以接收工作方面的帮助。 为特定用例设计 copilot 时,需要确保语言模型已建立基础,并使用与用户所需内容相关的事实信息。

虽然语言模型针对大量数据进行了训练,但它们可能无权访问你想要向用户提供的知识。 若要确保 copilot 基于特定数据以提供准确且特定于域的响应,可使用检索增强生成 (RAG)

了解 RAG

RAG 是一种可用于建立语言模型基础的技术。 换句话说,它是检索与用户的初始提示相关的信息的过程。 一般情况下,RAG 模式包含以下步骤:

检索增强生成模式的关系图。

  1. 根据用户输入的初始提示检索基础数据。
  2. 使用基础数据增强提示。
  3. 使用语言模型生成有根据的响应。

通过从指定数据源检索上下文,确保语言模型在响应时使用相关信息,而不是依赖其训练数据。

对于许多情况,使用 RAG 是一种强大且易于使用的技术,在这些情况下,你想要建立自己的语言模型基础并提高 copilot 响应的事实准确性。

向 Azure AI 项目添加基础数据

可以使用 Azure AI Studio 构建使用你自己的数据为提示提供根据的自定义助手。 Azure AI Studio 支持一系列数据连接,可用于向项目添加数据,包括:

  • Azure Blob 存储
  • Azure Data Lake Storage Gen2
  • Microsoft OneLake

还可以将文件或文件夹上传到你的 AI Studio 项目使用的存储。

Azure AI Studio 中“添加数据”对话框的屏幕截图。