共用方式為


使用 AutoML Python API 定型回歸模型

本文示範如何使用 AutoML Python API 使用 AutoML 來定型模型。 如需詳細資訊,請參閱 AutoML Python API 參考

API 提供函數來啟動分類、迴歸和預測 AutoML 執行。 每個函數呼叫都會訓練一組模型,並為每個模型產生試用筆記本。

請參閱 AutoML 實驗的需求

使用 AutoML API 設定實驗

下列步驟概括性地描述了如何使用 API 設定 AutoML 實驗:

  1. 建立筆記本,並將其連結至執行 Databricks Runtime ML 的叢集。

  2. 識別要從現有資料來源使用的資料表,或將資料檔案上傳至 DBFS 並建立資料表。

  3. 若要啟動 AutoML 執行,請使用 automl.regress()automl.classify()automl.forecast() 函式並傳遞數據表,以及任何其他定型參數。 若要查看所有函式和參數,請參閱 AutoML Python API 參考

    注意

    automl.forecast() 式僅適用於 傳統計算的預測。

    例如:

    # Regression example
    summary = automl.regress(dataset=train_pdf, target_col="col_to_predict")
    
    # Classification example
    summary = automl.classification(dataset=train_pdf, target_col="col_to_predict")
    
    # Forecasting example
    summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")
    
  4. 當 AutoML 執行開始時,主控台中會出現 MLflow 實驗 URL。 使用此 URL 來監視執行的進度。 重新整理 MLflow 實驗,以查看已完成的試用。

  5. 在 AutoML 執行完成之後:

  • 使用輸出摘要中的連結,來瀏覽至產生最佳結果的 MLflow 實驗或筆記本。
  • 使用資料探索筆記本的連結,以深入了解傳遞至 AutoML 的資料。 您也可以將此筆記本連結至相同的叢集,然後重新執行以重現結果或執行其他資料分析。
  • 使用從 AutoML 呼叫傳回的摘要物件,來探索有關試用的更多詳細資料,或載入由指定試用訓練的模型。 深入了解 AutoMLSummary 物件
  • 從試用複製任何產生的筆記本,然後將其連結至相同的叢集以重現結果,來加以重新執行。 您也可以進行必要的編輯、重新執行以訓練其他模型,並將其記錄到相同的實驗中。

匯入筆記本

若要匯入儲存為 MLflow 成品的筆記本,請使用 databricks.automl.import_notebook Python API。 如需詳細資訊,請參閱匯入筆記本

註冊和部署模型

您可以註冊和部署 AutoML 訓練的模型,就像 MLflow 模型登錄中的任何已註冊模型一樣;請參閱記錄、載入、註冊和部署 MLflow 模型

沒有名為 pandas.core.indexes.numeric 的模組

透過模型服務為使用 AutoML 建置的模型提供服務時,您可能會收到錯誤:No module named pandas.core.indexes.numeric

這是由於 AutoML 與模型服務端點環境之間的 pandas 版本不相容。 若要解決此錯誤:

  1. 下載 add-pandas-dependency.py 腳本。 此指令碼會為您記錄的模型編輯 requirements.txtconda.yaml,以包含適當的 pandas 相依性版本:pandas==1.5.3
  2. 修改指令碼以包含記錄模型時所在的 MLflow 執行的 run_id
  3. 將模型重新註冊至 MLflow 模型登錄。
  4. 嘗試為新版 MLflow 模型提供服務。

筆記本範例

下列筆記本示範如何使用 AutoML 進行迴歸。

AutoML 迴歸範例筆記本

取得筆記本

下一步

AutoML Python API 參考