探索 Azure AI Studio 中的微調語言模型
當您想要微調語言模型時,可以使用已預先定型大量資料的基本或基礎模型。 Azure AI Studio 中的模型目錄提供許多基礎模型。 您可以微調各種工作的基本模型,例如文字分類、翻譯或聊天完成。
當您想要使用微調的模型在聊天應用程式中產生回應時,必須使用可在聊天完成工作中微調的基本模型。 Azure AI Studio 模型目錄可讓您根據微調工作進行篩選,以決定要選取的基本模型。 例如,您可以選取 GPT-4 或 Llama-2-7b 模型,以微調您自己的定型資料。
若要從 Azure AI Foundry 的模型目錄微調語言模型,您可以使用入口網站中提供的使用者介面。
選取基底模型
當您在 Azure AI Foundry 入口網站中瀏覽至模型目錄時,您可以探索所有可用的語言模型。
注意
雖然所有的可用語言模型都會出現在 Azure AI Foundry 模型目錄中,但根據可用的配額,您可能無法微調您想要的模型。 請確定您要微調的模型可在您建立 AI 中樞的區域中取得。
您可以根據想要微調模型的工作篩選可用的模型。 每個工作都有數個選項可供基礎模型選擇。 決定工作的基礎模型時,您可以檢查模型的描述以及參考的模型卡片。
決定為基礎模型進行微調之前,您不妨考量以下事項:
- 模型功能:評估基礎模型的功能及其與您工作的配合程度。 例如,BERT 之類的模型適合用來了解簡短文字。
- 預先定型資料:請考慮用於預先定型基礎模型的資料集。 例如,GPT-2 會根據網際網路上未經篩選而容易造成偏差的內容進行定型。
- 限制和偏差:請注意基礎模型中可能存在的任何限制或偏差。
- 語言支援:探索哪些模型提供特定語言支援或多語系功能,可滿足您的使用案例所需。
提示
雖然 Azure AI Foundry 入口網站提供模型目錄中每個基礎模型的描述,您仍可透過個別模型卡片進一步找到每個模型的詳細資訊。 模型卡片可在各模型概觀中參考,並裝載於 Hugging Face 網站。
設定微調作業
若要使用 Azure AI Foundry 入口網站設定微調作業,請執行下列步驟:
- 選取基底模型。
- 選取您的定型資料。
- (選擇性) 選取您的驗證資料。
- 設定進階選項。
當您提交模型以進行微調時,模型會根據您的資料進一步定型。 若要設定微調或定型作業,您可以指定下列進階選項:
名稱 | 描述 |
---|---|
batch_size | 用於定型的批次大小。 批次大小是用來訓練單一向前和向後傳遞的訓練範例數目。 一般而言,較大的批次大小較適合較大的資料集。 這個屬性的預設值和最大值是特定於基本模型。 批次大小越大,表示模型參數的更新頻率越低,而變異數越少。 |
learning_rate_multiplier | 用於定型的學習速率乘數。 微調學習率是預先限制的原始學習率乘以此值。 學習速率越大,通常在越大的批次大小下擁有更佳效能。 建議您試驗 0.02 到 0.2 這個範圍內的值,看看哪些值會產生最佳結果。 較小的學習速率可能有助於避免過度學習。 |
n_epochs | 定型模型的 Epoch 數目。 Epoch 是指透過定型資料集的完整循環。 |
seed | 種子會控制作業的重現性。 傳入相同的種子和作業參數應該會產生相同的結果,但在罕見的情況下,可能會有所不同。 如果未指定種子,則會為您產生一個種子。 |
提交微調作業之後,系統會建立作業來定型模型。 您可以在作業執行時檢閱其狀態。 作業完成之後,當您想要了解微調模型的建立方式時,可以檢閱輸入參數。
如果您新增了驗證資料集,可以藉由探索模型在驗證資料集上執行的方式來檢閱模型的效能。
或者,您一律可以部署微調的模型。 部署模型之後,您可以測試模型來評估其效能。 當您滿意微調的模型時,可以將已部署的模型與聊天應用程式整合。