在 Azure Databricks 上使用 scikit-learn
此頁面提供如何使用 scikit-learn
套件在 Azure Databricks 中訓練機器學習模型的範例。 scikit-learn 是適用於單一節點機器學習最常用的 Python 程式庫之一,且包含於 Databricks Runtime 和 Databricks Runtime ML。 如需叢集執行階段隨附的 scikit-learn 程式庫版本資訊,請參閱 Databricks Runtime 版本資訊。
您也可以匯入這些 Notebook,並在您的 Databricks 工作區執行。
如需在 Azure Databricks 上快速開始使用的其他範例 Notebook,請參閱教學課程:開始使用 AI 和機器學習。
使用 scikit-learn 的基本範例
此 Notebook 提供 Azure Databricks 上機器學習模型訓練的快速概觀。 它會使用 scikit-learn
套件訓練簡單的分類模型。 也說明如何使用 MLflow 來追蹤模型開發流程,以及 Optuna 將超參數微調自動化。
如果您的工作區已啟用 Unity 目錄,請使用此版本的 Notebook:
scikit-learn 分類 Notebook (Unity 目錄)
如果您的工作區未啟用 Unity 目錄,請使用此版本的 Notebook:
scikit-learn 分類 Notebook
在 Azure Databricks 上使用 scikit-learn 的端對端範例
此 Notebook 使用 scikit-learn 來說明載入資料、模型訓練、分散式超參數微調和模型推斷的完整端對端範例。 它也說明使用 MLflow 模型登錄來記錄和註冊您模型的模型生命週期管理。
如果您的工作區已啟用 Unity 目錄,請使用此版本的 Notebook:
在 Databricks 上使用 scikit-learn 與 MLflow 整合 (Unity 目錄)
如果您的工作區未啟用 Unity 目錄,請使用此版本的 Notebook: