使用語言模型

已完成

組織和開發人員可以從頭開始定型自己的語言模型,但在大多數案例中,使用現有的基礎模型會比較實際,且可選擇性地使用您自己的定型資料微調該模型。 有許多您可以使用的模型來源。

在 Microsoft Azure 上,您可以在 Azure OpenAI 服務和模型目錄中找到基礎模型。 模型目錄是使用 Azure AI Studio 和 Azure Machine Learning 為資料科學家和開發人員策劃的模型來源。 此目錄提供尖端語言模型的優點,例如模型的生成式預先定型轉換器 (GPT) 集合 (ChatGPT 和 Microsoft 自己的生成式 AI 服務所根據的基礎),以及用於映像產生的 DALL-E 模型。 從 Azure OpenAI 服務使用這些模型,表示您也可以從裝載模型的安全、可調整 Azure 雲端平台中獲益。

除了 Azure OpenAI 模型之外,模型目錄還包含來自 Microsoft 和多個合作夥伴的最新開放原始碼模型,包括:

  • OpenAI
  • HuggingFace
  • Mistral
  • Meta 和其他。

一些常見的 Azure OpenAI 模型如下:

  • GPT-3.5-Turbo、GPT-4 和 GPT-4o:對話傳入和訊息輸出語言模型。
  • GPT-4 Turbo with Vision:OpenAI 所開發的語言模型,可分析影像並提供文字回應,以回答有關影像的問題。 它同時包含自然語言處理和視覺理解。
  • DALL-E:產生原始影像、影像變化,並可編輯影像的語言模型。

大型和小型語言模型

有許多語言模型可供您用來驅動生成式 AI 應用程式。 一般而言,語言模型可分為兩種:大型語言模型 (LLM) 和 小型語言模型 (SLM)。

大型語言模型 (LLM) 小型語言模型 (SLM)
會使用大量的文字來定型 LLM,這些文字代表廣泛的一般主題,通常是從網際網路和其他正式發行的出版物取得資料。 會使用較小、主題性更強的資料集定型 SLM
定型時,LLM 有數十億個 (甚至數萬億個) 參數 (可套用至向量內嵌以計算預測權杖序列的權數)。 SLM 的參數通常比 LLM 少。
能夠在各種交談內容中展示全面的語言產生功能。 此焦點詞彙使得 SLM 在特定的交談主題中非常有效,但在較普遍的語言產生方面效果較不顯著。
SLM 較大的大小可能會影響其效能,且使得使用者難以在裝置和電腦上本機部署 SLM。 較小的 SLM 大小可以提供更多部署選項,包括裝置和內部部署電腦的本機部署;並加快和簡化 SLM 的微調。
就執行額外定型所需的計算能力而言,使用額外的資料微調模型以自訂其主題專業知識,可能非常耗時且昂貴。 微調可能較不耗時與較不昂貴。