Dela via


Träna prognosmodeller med AutoML Python API

Den här artikeln visar hur du tränar en modell med AutoML med Hjälp av AutoML Python API. Mer information finns i Referens för AutoML Python API .

API:et tillhandahåller funktioner för att starta klassificering, regression och prognostisering av AutoML-körningar. Varje funktionsanrop tränar en uppsättning modeller och genererar en utvärderingsanteckningsbok för varje modell.

Se Krav för AutoML-experiment.

Konfigurera ett experiment med autoML-API:et

Följande steg beskriver vanligtvis hur du konfigurerar ett AutoML-experiment med hjälp av API:et:

  1. Skapa en notebook-fil och koppla den till ett kluster som kör Databricks Runtime ML.

  2. Identifiera vilken tabell du vill använda från din befintliga datakälla eller ladda upp en datafil till DBFS och skapa en tabell.

  3. Om du vill starta en AutoML-körning använder du automl.regress()funktionen , automl.classify()eller automl.forecast() och skickar tabellen tillsammans med andra träningsparametrar. Information om hur du ser alla funktioner och parametrar finns i AutoML Python API-referens.

    Kommentar

    Funktionen automl.forecast() är endast tillgänglig för prognostisering för klassisk beräkning.

    Till exempel:

    # Regression example
    summary = automl.regress(dataset=train_pdf, target_col="col_to_predict")
    
    # Classification example
    summary = automl.classification(dataset=train_pdf, target_col="col_to_predict")
    
    # Forecasting example
    summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")
    
  4. När AutoML-körningen börjar visas en URL för MLflow-experiment i konsolen. Använd den här URL:en för att övervaka körningens förlopp. Uppdatera MLflow-experimentet för att se utvärderingsversionerna när de har slutförts.

  5. När AutoML-körningen är klar:

  • Använd länkarna i utdatasammanfattningen för att navigera till MLflow-experimentet eller anteckningsboken som genererade bästa resultat.
  • Använd länken till notebook-filen för datautforskning för att få insikter om de data som skickas till AutoML. Du kan också koppla den här notebook-filen till samma kluster och köra den igen för att återskapa resultaten eller utföra ytterligare dataanalys.
  • Använd sammanfattningsobjektet som returneras från AutoML-anropet för att utforska mer information om utvärderingsversionerna eller för att läsa in en modell som tränats av en viss utvärderingsversion. Läs mer om AutoMLSummary-objektet.
  • Klona alla genererade notebook-filer från utvärderingsversionerna och kör den igen genom att koppla den till samma kluster för att återskapa resultatet. Du kan också göra nödvändiga ändringar, köra dem igen för att träna ytterligare modeller och logga in dem i samma experiment.

Importera en notebook-fil

Om du vill importera en notebook-fil som sparats som en MLflow-artefakt använder du Python-API:et databricks.automl.import_notebook . Mer information finns i Importera notebook-fil

Registrera och distribuera en modell

Du kan registrera och distribuera din AutoML-tränade modell precis som vilken registrerad modell som helst i MLflow-modellregistret. se Logga, läsa in, registrera och distribuera MLflow-modeller.

Ingen modul med namnet pandas.core.indexes.numeric

När du betjänar en modell som skapats med AutoML med modellservering kan du få felet: No module named pandas.core.indexes.numeric.

Detta beror på en inkompatibel pandas version mellan AutoML och modellen som betjänar slutpunktsmiljön. Så här åtgärdar du felet:

  1. Ladda ned add-pandas-dependency.py skriptet. Skriptet redigerar requirements.txt och conda.yaml för den loggade modellen så att den innehåller rätt pandas beroendeversion: pandas==1.5.3.
  2. Ändra skriptet så att det run_id inkluderar MLflow-körningen där din modell loggades.
  3. Registrera om modellen till MLflow-modellregistret.
  4. Prova att hantera den nya versionen av MLflow-modellen.

Notebook-exempel

Följande notebook-fil visar hur du utför prognostisering med AutoML.

Exempelanteckningsbok för AutoML-prognostisering

Hämta notebook-fil

Nästa steg

AutoML Python API-referens.