Delen via


Classificatiemodellen trainen met De AutoML Python-API

In dit artikel wordt beschreven hoe u een model traint met AutoML met behulp van de AutoML Python-API. Zie naslaginformatie over de Python-API voor AutoML voor meer informatie.

De API biedt functies voor het starten van classificatie, regressie en het voorspellen van AutoML-uitvoeringen. Elke functieoproep traint een set modellen en genereert een proefnotitieblok voor elk model.

Zie Vereisten voor AutoML-experimenten.

Een experiment instellen met behulp van de AutoML-API

In de volgende stappen wordt over het algemeen beschreven hoe u een AutoML-experiment instelt met behulp van de API:

  1. Maak een notebook en koppel deze aan een cluster met Databricks Runtime ML.

  2. Bepaal welke tabel u wilt gebruiken vanuit uw bestaande gegevensbron of een gegevensbestand uploaden naar DBFS en een tabel maken.

  3. Als u een AutoML-uitvoering wilt starten, gebruikt u de automl.regress(), automl.classify()of automl.forecast() functie en geeft u de tabel door, samen met eventuele andere trainingsparameters. Zie Naslaginformatie over de AutoML Python-APIvoor alle functies en parameters.

    Notitie

    De automl.forecast() functie is alleen beschikbaar voor prognoses op klassieke berekeningen.

    Voorbeeld:

    # Regression example
    summary = automl.regress(dataset=train_pdf, target_col="col_to_predict")
    
    # Classification example
    summary = automl.classification(dataset=train_pdf, target_col="col_to_predict")
    
    # Forecasting example
    summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")
    
  4. Wanneer de AutoML-uitvoering wordt gestart, wordt er een MLflow-experiment-URL weergegeven in de console. Gebruik deze URL om de voortgang van de uitvoering te controleren. Vernieuw het MLflow-experiment om de proefversies te zien wanneer deze zijn voltooid.

  5. Nadat de AutoML-uitvoering is voltooid:

  • Gebruik de koppelingen in het uitvoeroverzicht om naar het MLflow-experiment of het notebook te navigeren dat de beste resultaten heeft gegenereerd.
  • Gebruik de koppeling naar het notebook voor gegevensverkenning om inzicht te krijgen in de gegevens die worden doorgegeven aan AutoML. U kunt dit notebook ook aan hetzelfde cluster koppelen en opnieuw uitvoeren om de resultaten te reproduceren of aanvullende gegevensanalyse uit te voeren.
  • Gebruik het samenvattingsobject dat is geretourneerd vanuit de AutoML-aanroep om meer informatie over de proefversies te verkennen of om een model te laden dat is getraind door een bepaalde proefversie. Meer informatie over het AutoMLSummary-object.
  • Kloon een gegenereerd notebook uit de proefversies en voer het opnieuw uit door het te koppelen aan hetzelfde cluster om de resultaten te reproduceren. U kunt ook de benodigde wijzigingen aanbrengen, ze opnieuw uitvoeren om extra modellen te trainen en ze aan te melden bij hetzelfde experiment.

Een notebook importeren

Als u een notebook wilt importeren dat is opgeslagen als een MLflow-artefact, gebruikt u de databricks.automl.import_notebook Python-API. Zie Notitieblok importeren voor meer informatie

Een model registreren en implementeren

U kunt uw door AutoML getrainde model registreren en implementeren, net zoals elk geregistreerd model in het MLflow-modelregister; zie MLflow-modellenregistreren, laden en registreren.

Geen module met de naam pandas.core.indexes.numeric

Bij het serveren van een model dat is gebouwd met behulp van AutoML via Model Serving, krijgt u mogelijk de foutmelding: No module named pandas.core.indexes.numeric.

Dit komt door een incompatibele pandas versie tussen AutoML en het model voor eindpuntomgeving. Los deze fout als volgt op:

  1. Download het add-pandas-dependency.py script. Het script bewerkt het requirements.txt en conda.yaml voor het geregistreerde model om de juiste pandas afhankelijkheidsversie op te nemen: pandas==1.5.3
  2. Wijzig het script om de run_id van de run van MLflow op te nemen waarin uw model is gelogd.
  3. Het model opnieuw registreren bij het MLflow-modelregister.
  4. Probeer de nieuwe versie van het MLflow-model te leveren.

Voorbeeld van notitieblok

In het volgende notebook ziet u hoe u classificatie kunt uitvoeren met AutoML.

Voorbeeldnotitieblok voor AutoML-classificatie

Notitieblok ophalen

Volgende stappen

Naslaginformatie over de AutoML Python-API.