Databricks 上的大语言模型 (LLM)

使用 Azure Databricks 可以轻松访问和构建公开发布的大型语言模型。

用于机器学习的 Databricks Runtime 包括 Hugging Face Transformers 和 LangChain 等库;使用这些库,你可将已预先训练的现有模型或其他开源库集成到工作流中。 在这里,你可以利用 Azure Databricks 平台功能使用自己的数据优化 LLM,以提高域性能。

此外,Azure Databricks 还提供内置功能,供 SQL 用户使用 AI 函数访问和试验 Azure OpenAI 和 OpenAI 等 LLM。

基础模型微调

重要

此功能目前以公共预览版提供。 联系你的 Databricks 帐户团队以注册公共预览版。

基础模型微调(现在是马赛克 AI 模型训练的一部分)是 Databricks 训练堆栈的简单界面,用于执行完整的模型微调。

可以使用基础模型微调执行以下操作:

  • 使用自定义数据微调模型,并将检查点保存到 MLflow。 保留对微调模型的完全控制。
  • 自动将模型注册到 Unity Catalog,以便通过模型服务进行轻松部署。
  • 通过加载以前的微调模型的权重来微调已完成的专有模型。

请参阅 基础模型微调

Hugging Face Transformers

借助 Databricks 上的 Hugging Face Transformers,可以横向扩展自然语言处理 (NLP) 批处理应用程序,并优化大型语言模型应用程序的模型。

Hugging Face transformers 库已预装在 Databricks Runtime 10.4 LTS ML 及更高版本上。 许多常用的 NLP 模型在 GPU 硬件上可以保持最佳工作状态,因此你可以使用最新的 GPU 硬件来获得最佳性能,除非你使用专门针对 CPU 优化的模型。

DSPy

DSPy 通过将用户定义的自然语言签名翻译为完整的说明和几个示例来自动执行提示优化。

有关如何使用 DSPy 的示例,请参阅 在 Azure Databricks 上使用 DSPy 生成 genAI 应用。

LangChain

LangChain 以试验性 MLflow 风格提供,允许 LangChain 客户直接从 Azure Databricks 环境利用 MLflow 的强大工具和试验跟踪功能。

LangChain 是一个软件框架,旨在帮助创建利用大型语言模型 (LLM) 的应用程序,并将其与外部数据相结合,为你的 LLM 带来更多的训练上下文。

Databricks Runtime ML 包括 Databricks Runtime 13.1 ML 及更高版本中的 langchain

了解特定于 Databricks 的 LangChain 集成

AI 函数

重要

此功能目前以公共预览版提供。

AI 函数是内置 SQL 函数,允许 SQL 用户执行以下操作:

  • 使用 Databricks Foundation 模型 API 完成公司数据的各种任务。
  • 从 OpenAI 访问 GPT-4 等外部模型并对其进行试验。
  • 由 Mosaic AI 模型托管的查询模型为 SQL 查询中的终结点提供服务。