訓練 AI 和 ML 模型

發行項
11/19/2024

本節說明如何在 Mosaic AI 上訓練機器學習和 AI 模型。

馬賽克 AI 模型訓練可簡化並統一透過 AutoML 和基礎模型微調工作負載來定型和部署傳統 ML 模型的程式。

AutoML

AutoML 可自動為您尋找最佳的演算法和超參數位態，簡化將機器學習套用至數據集的程式。 AutoML 提供無程式代碼 UI 和 Python API。

基礎模型微調

Databricks 上的基礎模型微調（現在是馬賽克 AI 模型訓練的一部分），可讓您使用自己的數據自定義大型語言模型（LLM）。此程序牽涉到微調預先存在的基礎模型的訓練，相較於從頭訓練模型，可大幅減少所需的資料、時間和計算資源。主要功能包括：

受監督的微調：透過對結構化提示回應資料進行訓練，調整您的模型以新的工作。
持續預先訓練：使用其他文字資料增強模型，以新增知識或專注於特定領域。
聊天完成：在聊天記錄上訓練您的模型，以提升交談能力。

開放原始碼程式庫範例

請參閱各種開放原始碼機器學習程式庫的機器學習訓練範例，包括使用 Optuna 和 Hyperopt 的超參數微調範例。

深度學習

請參閱分散式深度學習訓練的範例和最佳做法，讓您可以在 Azure Databricks 上開發和微調深度學習模型。

推薦

了解如何在 Azure Databricks 上訓練深度學習型建議模型。與舊版建議程式模型相比，深度學習模型可以達到更高品質的結果，並可擴展至更大的資料量。