使用 AutoML Python API 定型回歸模型
本文示範如何使用 AutoML Python API 使用 AutoML 來定型模型。 如需詳細資訊,請參閱 AutoML Python API 參考 。
API 提供函數來啟動分類、迴歸和預測 AutoML 執行。 每個函數呼叫都會訓練一組模型,並為每個模型產生試用筆記本。
請參閱 AutoML 實驗的需求。
使用 AutoML API 設定實驗
下列步驟概括性地描述了如何使用 API 設定 AutoML 實驗:
建立筆記本,並將其連結至執行 Databricks Runtime ML 的叢集。
識別要從現有資料來源使用的資料表,或將資料檔案上傳至 DBFS 並建立資料表。
若要啟動 AutoML 執行,請使用
automl.regress()
、automl.classify()
或automl.forecast()
函式並傳遞數據表,以及任何其他定型參數。 若要查看所有函式和參數,請參閱 AutoML Python API 參考。注意
函
automl.forecast()
式僅適用於 傳統計算的預測。例如:
# Regression example summary = automl.regress(dataset=train_pdf, target_col="col_to_predict") # Classification example summary = automl.classification(dataset=train_pdf, target_col="col_to_predict") # Forecasting example summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")
當 AutoML 執行開始時,主控台中會出現 MLflow 實驗 URL。 使用此 URL 來監視執行的進度。 重新整理 MLflow 實驗,以查看已完成的試用。
在 AutoML 執行完成之後:
- 使用輸出摘要中的連結,來瀏覽至產生最佳結果的 MLflow 實驗或筆記本。
- 使用資料探索筆記本的連結,以深入了解傳遞至 AutoML 的資料。 您也可以將此筆記本連結至相同的叢集,然後重新執行以重現結果或執行其他資料分析。
- 使用從 AutoML 呼叫傳回的摘要物件,來探索有關試用的更多詳細資料,或載入由指定試用訓練的模型。 深入了解 AutoMLSummary 物件。
- 從試用複製任何產生的筆記本,然後將其連結至相同的叢集以重現結果,來加以重新執行。 您也可以進行必要的編輯、重新執行以訓練其他模型,並將其記錄到相同的實驗中。
匯入筆記本
若要匯入儲存為 MLflow 成品的筆記本,請使用 databricks.automl.import_notebook
Python API。 如需詳細資訊,請參閱匯入筆記本
註冊和部署模型
您可以註冊和部署 AutoML 訓練的模型,就像 MLflow 模型登錄中的任何已註冊模型一樣;請參閱記錄、載入、註冊和部署 MLflow 模型。
沒有名為 pandas.core.indexes.numeric
的模組
透過模型服務為使用 AutoML 建置的模型提供服務時,您可能會收到錯誤:No module named pandas.core.indexes.numeric
。
這是由於 AutoML 與模型服務端點環境之間的 pandas
版本不相容。 若要解決此錯誤:
- 下載 add-pandas-dependency.py 腳本。
此指令碼會為您記錄的模型編輯
requirements.txt
和conda.yaml
,以包含適當的pandas
相依性版本:pandas==1.5.3
。 - 修改指令碼以包含記錄模型時所在的 MLflow 執行的
run_id
。 - 將模型重新註冊至 MLflow 模型登錄。
- 嘗試為新版 MLflow 模型提供服務。
筆記本範例
下列筆記本示範如何使用 AutoML 進行迴歸。