Condividi tramite


Eseguire il training di modelli di regressione con l'API Python AutoML

Questo articolo illustra come eseguire il training di un modello con AutoML usando l'API Python AutoML. Per altre informazioni, vedere Informazioni di riferimento sull'API Python di AutoML.

L'API fornisce funzioni per avviare la classificazione, regressione e previsione di esecuzioni di AutoML. Ogni chiamata di funzione allena un set di modelli e genera un notebook di prova per ogni modello.

Consulta i Requisiti per gli esperimenti AutoML.

Configurare un esperimento usando l'API AutoML

I passaggi seguenti descrivono in genere come configurare un esperimento AutoML usando l'API:

  1. Creare un notebook e collegarlo a un cluster che esegue Databricks Runtime ML.

  2. Identificare la tabella da usare dall'origine dati esistente o caricare un file di dati in DBFS e creare una tabella.

  3. Per avviare un'esecuzione autoML, usare la funzione automl.regress(), automl.classify()o automl.forecast() e passare la tabella insieme ad altri parametri di training. Per visualizzare tutte le funzioni e i parametri, vedere riferimento all'API Python AutoML.

    Nota

    La automl.forecast() funzione è disponibile solo per la previsione nel calcolo classico.

    Ad esempio:

    # Regression example
    summary = automl.regress(dataset=train_pdf, target_col="col_to_predict")
    
    # Classification example
    summary = automl.classification(dataset=train_pdf, target_col="col_to_predict")
    
    # Forecasting example
    summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")
    
  4. All'avvio dell'esecuzione AutoML, nella console viene visualizzato un URL dell'esperimento MLflow. Usare questo URL per monitorare lo stato dell'esecuzione. Aggiorna l'esperimento MLflow per vedere le prove man mano che vengono completate.

  5. Al termine dell'esecuzione di AutoML:

  • Usare i collegamenti nel riepilogo dell'output per passare all'esperimento MLflow o al notebook che ha generato i risultati migliori.
  • Usare il collegamento al notebook di esplorazione dei dati per ottenere informazioni dettagliate sui dati passati a AutoML. È anche possibile collegare questo notebook allo stesso cluster ed eseguirlo di nuovo per riprodurre i risultati o eseguire ulteriori analisi dei dati.
  • Usare l'oggetto di riepilogo restituito dalla chiamata AutoML per esplorare altri dettagli sulle versioni di valutazione o caricare un modello sottoposto a training da una determinata versione di prova. Altre informazioni sull'oggetto AutoMLSummary.
  • Clonare qualsiasi notebook generato dalle versioni di valutazione ed eseguirlo di nuovo collegandolo allo stesso cluster per riprodurre i risultati. È anche possibile apportare modifiche necessarie, eseguirle nuovamente per eseguire il training di modelli aggiuntivi e registrarle nello stesso esperimento.

Importare un notebook

Per importare un notebook salvato come artefatto MLflow, usare databricks.automl.import_notebook l’API Python. Per altre informazioni, consultare il notebook sull’importazione

Registrare e implementare un modello

È possibile registrare e distribuire un modello addestrato con AutoML esattamente come qualsiasi modello registrato nel registro dei modelli di MLflow; vedere Log, load e register MLflow models.

Nessun modulo rinominato pandas.core.indexes.numeric

Quando si gestisce un modello compilato usando AutoML con Model Serving, è possibile che venga visualizzato l'errore: No module named pandas.core.indexes.numeric.

Ciò è dovuto a una versione incompatibile pandas tra AutoML e l'ambiente endpoint di gestione del modello. Per risolvere l'errore:

  1. Scaricare lo script add-pandas-dependency.py. Lo script modifica il requirements.txt e conda.yaml per il modello registrato in modo da includere l’appropriata pandasversione di dipendenza: pandas==1.5.3.
  2. Modificare lo script per includere la run_id dell'esecuzione MLflow in cui è stato registrato il modello.
  3. Registrare nuovamente il modello nel Registro di sistema del modello MLflow.
  4. Provare a gestire la nuova versione del modello MLflow.

Esempio di notebook

Il seguente notebook illustra come eseguire la regressione con AutoML.

Notebook di esempio di regressione AutoML

Ottieni notebook

Passaggi successivi

Informazioni di riferimento sulle API Python autoML.