訓練 AI 和 ML 模型
本節說明如何在 Mosaic AI 上訓練機器學習和 AI 模型。
馬賽克 AI 模型訓練可簡化並統一透過 AutoML 和基礎模型微調工作負載來定型和部署傳統 ML 模型的程式。
AutoML
AutoML 可自動為您尋找最佳的演算法和超參數位態,簡化將機器學習套用至數據集的程式。 AutoML 提供無程式代碼 UI 和 Python API。
基礎模型微調
Databricks 上的基礎模型微調 (現在是馬賽克 AI 模型訓練的一部分),可讓您使用自己的數據自定義大型語言模型(LLM)。 此程序牽涉到微調預先存在的基礎模型的訓練,相較於從頭訓練模型,可大幅減少所需的資料、時間和計算資源。 主要功能包括:
- 受監督的微調:透過對結構化提示回應資料進行訓練,調整您的模型以新的工作。
- 持續預先訓練:使用其他文字資料增強模型,以新增知識或專注於特定領域。
- 聊天完成:在聊天記錄上訓練您的模型,以提升交談能力。
開放原始碼程式庫範例
請參閱各種開放原始碼機器學習程式庫的機器學習訓練範例,包括使用 Optuna 和 Hyperopt 的超參數微調範例。
深度學習
請參閱分散式深度學習訓練的範例和最佳做法,讓您可以在 Azure Databricks 上開發和微調深度學習模型。
推薦
了解如何在 Azure Databricks 上訓練深度學習型建議模型。 與舊版建議程式模型相比,深度學習模型可以達到更高品質的結果,並可擴展至更大的資料量。