共用方式為


使用 AutoML Python API 將分類模型定型

本文示範如何使用 AutoML Python API 使用 AutoML 來定型模型。 如需詳細資訊,請參閱 AutoML Python API 參考

API 提供函數來啟動分類、迴歸和預測 AutoML 執行。 每次函式呼叫都會訓練 set 個模型,並為每個模型產生試驗筆記本。

請參閱 AutoML 實驗的需求

使用 AutoML API 設定實驗

下列步驟一般描述如何使用 API 來 set AutoML 實驗:

  1. 建立筆記本,並將其連結至執行 Databricks Runtime ML 的叢集。

  2. 識別您要從現有數據來源使用的 table,或 將數據檔上傳至 DBFS,並建立 table。

  3. 若要啟動 AutoML 運行,請使用 automl.regress()automl.classify()automl.forecast() 函式,並傳遞 table,以及任何其他訓練 parameters。 若要查看所有函式和 parameters,請參閱 AutoML Python API 參考

    注意

    automl.forecast() 式僅適用於 傳統計算的預測。

    例如:

    # Regression example
    summary = automl.regress(dataset=train_pdf, target_col="col_to_predict")
    
    # Classification example
    summary = automl.classification(dataset=train_pdf, target_col="col_to_predict")
    
    # Forecasting example
    summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")
    
  4. 當 AutoML 執行開始時,主控台中會出現 MLflow 實驗 URL。 使用此 URL 來監視執行的進度。 Refresh MLflow 實驗,以查看完成的試驗。

  5. 在 AutoML 執行完成之後:

  • 使用輸出摘要中的連結,來瀏覽至產生最佳結果的 MLflow 實驗或筆記本。
  • 使用資料探索筆記本的連結,以深入了解傳遞至 AutoML 的資料。 您也可以將此筆記本連結至相同的叢集,然後重新執行以重現結果或執行其他資料分析。
  • 使用從 AutoML 呼叫傳回的摘要物件,來探索有關試用的更多詳細資料,或載入由指定試用訓練的模型。 深入了解 AutoMLSummary 物件
  • 從試用複製任何產生的筆記本,然後將其連結至相同的叢集以重現結果,來加以重新執行。 您也可以進行必要的編輯、重新執行以訓練其他模型,並將其記錄到相同的實驗中。

匯入筆記本

若要匯入儲存為 MLflow 成品的筆記本,請使用 databricks.automl.import_notebook Python API。 如需詳細資訊,請參閱匯入筆記本

註冊和部署模型

您可以註冊和部署 AutoML 訓練的模型,就像 MLflow 模型登錄中的任何已註冊模型一樣;請參閱記錄、載入、註冊和部署 MLflow 模型

沒有名為 pandas.core.indexes.numeric 的模組

使用 AutoML 搭配模型服務建置的模型時,您可能會 get 錯誤:No module named pandas.core.indexes.numeric

這是由於 AutoML 與模型服務端點環境之間的 pandas 版本不相容。 若要解決此錯誤:

  1. 下載 add-pandas-dependency.py 腳本。 此指令碼會為您記錄的模型編輯 requirements.txtconda.yaml,以包含適當的 pandas 相依性版本:pandas==1.5.3
  2. 修改腳本以包含 MLflow 執行 run_id, 在該運行中登錄了您的模型 where。
  3. 將模型重新註冊至 MLflow 模型登錄。
  4. 嘗試為新版 MLflow 模型提供服務。

筆記本範例

下列筆記本示範如何使用 AutoML 進行分類。

AutoML 分類範例筆記本

Get 筆記本

下一步

AutoML Python API 參考