模型訓練範例
本節包含範例,示範如何使用許多熱門的開放原始碼連結庫,在 Azure Databricks 上定型機器學習模型。
您也可以使用 AutoML 來自動準備數據集以進行模型定型、使用 scikit-learn 和 XGBoost 等開放原始碼連結庫執行一組試用版,以及為每個試用版執行建立具有原始程式碼的 Python 筆記本,以便檢閱、重現和修改程式代碼。
機器學習範例
套件 | 筆記本(秒) | 功能 |
---|---|---|
scikit-learn | 機器學習教學課程 | Unity Catalog、分類模型、MLflow、使用 Hyperopt 和 MLflow 自動化超參數調整 |
scikit-learn | 端對端範例 | Unity Catalog、分類模型、MLflow、使用 Hyperopt 和 MLflow 自動化超參數調整、XGBoost |
MLlib | MLlib 範例 | 二元分類, 判定樹, GBT 回歸, 結構化串流, 自定義轉換器 |
xgboost | XGBoost 範例 | Python、PySpark 和 Scala、單一節點工作負載和分散式定型 |
超參數微調範例
如需 Azure Databricks 中超參數微調的一般資訊,請參閱 超參數微調。
套件 | 筆記本 | 功能 |
---|---|---|
Optuna | 開始使用 Optuna | Optuna、distributed Optuna、scikit-learn、MLflow |
Hyperopt | 分散式 Hyperopt | 分散式 Hyperopt、scikit-learn、MLflow |
Hyperopt | 比較模型 | 使用分散式超參數同時搜尋不同模型類型的超參數空間 |
Hyperopt | 分散式定型演算法和 Hyperopt | Hyperopt、MLlib |
Hyperopt | Hyperopt 最佳做法 | 不同大小的數據集最佳做法 |