共用方式為


在 Databricks 構建 gen AI 應用程式的介紹

Mosaic AI 提供構建、部署與管理 GenAI 應用程式的全面平台。 本文將引導您完成在 Databricks 開發 GenAI 應用程式所涉及的基本元件與流程。

部署和查詢生成式 AI 模型

針對簡單的使用案例,您可以直接提供和查詢 Gen AI 模型,包括高品質的開放原始碼模型,以及 LLM 的第三方模型 providers,例如 OpenAI 和 Anthropic。

Mosaic AI Model Serving 支援使用以下功能提供並查詢生成式 AI 模型:

  • 基礎模型 API。 此功能可為您的模型服務端點提供最先進的開放模型與微調模型變體。 這些模型是精心設計的基礎模型架構,支援最佳化推理。 基本模型,例如 DBRX 指示、Meta-Llama-3.1-70B-指示、GTE-Large 和 Mistral-7B,可立即搭配按令牌付費定價使用,以及需要效能保證的工作負載,例如微調的模型變體,可以使用布建的輸送量來部署
  • 外部模型。 這些是託管在 Databricks 外部的生成式 AI 模型。 服務於外部模型的端點可以集中管理,客戶可以為其建立速率限制與存取控制。 範例包括 OpenAI 的 GPT-4、Anthropic 的 Claude 等基礎模型。

請參閱 建立服務端點的基礎模型

Mosaic AI Agent Framework

馬賽克 AI 代理程式架構包含 Databricks 上的 set 工具,其設計目的是協助開發人員建置、部署及評估生產品質代理程式,例如擷取擴增世代 (RAG) 應用程式。

它與 LangChain 和 LlamaIndex 等第三方架構相容,可讓您使用慣用的架構進行開發,同時利用 Databricks 的受控 Unity Catalog、代理程式評估架構和其他平臺優點。

使用下列功能快速迭代代理程式開發:

  • 使用任何程式庫和 MLflow 建立和記錄代理程式。 將代理程式參數化,以快速實驗及迭代代理程式開發。
  • 代理程式追蹤可讓您記錄、分析及比較代理程式程式碼中的追蹤,以偵錯並瞭解代理程式如何回應要求。
  • 使用 DSPy 改善代理程序品質。 DSPy 可以自動化提示工程和微調,以改善 GenAI 代理程序的品質。
  • 將代理程式 部署至生產環境,並提供令牌串流和要求/回應記錄的原生支援,以及內建的檢閱應用程式,為您的代理程式 get 用戶意見反應。