Databricks 上的大型語言模型 (LLM)
Azure Databricks 可讓您輕鬆地存取及建置公開可用的大型語言模型。
適用於 機器學習 的 Databricks Runtime 包含 Hugging Face Transformers 和 LangChain 等連結庫,可讓您將現有的預先定型模型或其他開放原始碼連結庫整合到工作流程中。 您可以從這裡利用 Azure Databricks 平臺功能來微調使用您自己的數據來微調 LLM,以提升網域效能。
此外,Azure Databricks 還提供內建功能,讓 SQL 用戶能夠使用 AI 函式來存取和實驗 LLM,例如 Azure OpenAI 和 OpenAI。
基礎模型微調
重要
這項功能處於公開預覽狀態。 請連絡 Databricks 帳戶小組,以註冊公開預覽版。
基礎模型微調(現在是馬賽克 AI 模型訓練的一部分)是 Databricks 訓練堆疊的簡單介面,可執行完整的模型微調。
您可以使用基礎模型微調來執行下列動作:
- 使用自定義數據微調模型,並將檢查點儲存至 MLflow。 您可以保留微調模型的完整控制權。
- 自動將模型註冊至 Unity Catalog,輕輕鬆鬆便可將模型部署為服務。
- 藉由載入先前微調模型的權數,微調已完成的專屬模型。
請參閱 基礎模型微調。
Hugging Face Transformers
透過 Databricks 上的擁抱臉部轉換器,您可以相應放大自然語言處理 (NLP) 批次應用程式,並微調大型語言模型應用程式的模型。
擁抱臉部 transformers
連結庫已預安裝在 Databricks Runtime 10.4 LTS ML 和更新版本上。 許多熱門的 NLP 模型在 GPU 硬體上效果最佳,因此,除非您使用特別針對 CPU 使用優化的模型,否則您可能會使用最新的 GPU 硬體獲得最佳效能。
DSPy
DSPy 會將使用者定義的自然語言簽章轉譯成完整的指示和很少的範例,以自動化提示微調。
如需如何使用 DSPy 的範例,請參閱 在 Azure Databricks 上使用 DSPy 建置 genAI 應用程式。
LangChain
LangChain 可用作實驗性 MLflow 變體,讓 LangChain 客戶可以直接從 Azure Databricks 環境利用 MLflow 的強固工具和實驗追蹤功能。
LangChain 是一種軟體架構,旨在協助建立利用大型語言模型 (LLM) 的應用程式,並將其與外部數據結合,為您的 LLM 帶來更多的定型內容。
Databricks Runtime ML 包含 langchain
Databricks Runtime 13.1 ML 和更新版本。
瞭解 Databricks 特定的 LangChain 整合。
AI 函式
重要
這項功能處於公開預覽狀態。
AI 函 式是內建的 SQL 函式,可讓 SQL 使用者:
- 使用 Databricks Foundation 模型 API 來完成公司數據的各種工作。
- 從 OpenAI 存取 GPT-4 之類的外部模型,並加以實驗。
- 由馬賽克 AI 模型裝載的查詢模型從 SQL 查詢提供端點。