Classificatiemodellen trainen met De AutoML Python-API
In dit artikel wordt beschreven hoe u een model traint met AutoML met behulp van de AutoML Python-API. Zie naslaginformatie over de Python-API voor AutoML voor meer informatie.
De API biedt functies voor het starten van classificatie, regressie en het voorspellen van AutoML-uitvoeringen. Elke functieoproep traint een set modellen en genereert een proefnotitieblok voor elk model.
Zie Vereisten voor AutoML-experimenten.
Een experiment instellen met behulp van de AutoML-API
In de volgende stappen wordt over het algemeen beschreven hoe u een AutoML-experiment instelt met behulp van de API:
Maak een notebook en koppel deze aan een cluster met Databricks Runtime ML.
Bepaal welke tabel u wilt gebruiken vanuit uw bestaande gegevensbron of een gegevensbestand uploaden naar DBFS en een tabel maken.
Als u een AutoML-uitvoering wilt starten, gebruikt u de
automl.regress()
,automl.classify()
ofautoml.forecast()
functie en geeft u de tabel door, samen met eventuele andere trainingsparameters. Zie Naslaginformatie over de AutoML Python-APIvoor alle functies en parameters.Notitie
De
automl.forecast()
functie is alleen beschikbaar voor prognoses op klassieke berekeningen.Voorbeeld:
# Regression example summary = automl.regress(dataset=train_pdf, target_col="col_to_predict") # Classification example summary = automl.classification(dataset=train_pdf, target_col="col_to_predict") # Forecasting example summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")
Wanneer de AutoML-uitvoering wordt gestart, wordt er een MLflow-experiment-URL weergegeven in de console. Gebruik deze URL om de voortgang van de uitvoering te controleren. Vernieuw het MLflow-experiment om de proefversies te zien wanneer deze zijn voltooid.
Nadat de AutoML-uitvoering is voltooid:
- Gebruik de koppelingen in het uitvoeroverzicht om naar het MLflow-experiment of het notebook te navigeren dat de beste resultaten heeft gegenereerd.
- Gebruik de koppeling naar het notebook voor gegevensverkenning om inzicht te krijgen in de gegevens die worden doorgegeven aan AutoML. U kunt dit notebook ook aan hetzelfde cluster koppelen en opnieuw uitvoeren om de resultaten te reproduceren of aanvullende gegevensanalyse uit te voeren.
- Gebruik het samenvattingsobject dat is geretourneerd vanuit de AutoML-aanroep om meer informatie over de proefversies te verkennen of om een model te laden dat is getraind door een bepaalde proefversie. Meer informatie over het AutoMLSummary-object.
- Kloon een gegenereerd notebook uit de proefversies en voer het opnieuw uit door het te koppelen aan hetzelfde cluster om de resultaten te reproduceren. U kunt ook de benodigde wijzigingen aanbrengen, ze opnieuw uitvoeren om extra modellen te trainen en ze aan te melden bij hetzelfde experiment.
Een notebook importeren
Als u een notebook wilt importeren dat is opgeslagen als een MLflow-artefact, gebruikt u de databricks.automl.import_notebook
Python-API. Zie Notitieblok importeren voor meer informatie
Een model registreren en implementeren
U kunt uw door AutoML getrainde model registreren en implementeren, net zoals elk geregistreerd model in het MLflow-modelregister; zie MLflow-modellenregistreren, laden en registreren.
Geen module met de naam pandas.core.indexes.numeric
Bij het serveren van een model dat is gebouwd met behulp van AutoML via Model Serving, krijgt u mogelijk de foutmelding: No module named pandas.core.indexes.numeric
.
Dit komt door een incompatibele pandas
versie tussen AutoML en het model voor eindpuntomgeving. Los deze fout als volgt op:
- Download het add-pandas-dependency.py script.
Het script bewerkt het
requirements.txt
enconda.yaml
voor het geregistreerde model om de juistepandas
afhankelijkheidsversie op te nemen:pandas==1.5.3
- Wijzig het script om de
run_id
van de run van MLflow op te nemen waarin uw model is gelogd. - Het model opnieuw registreren bij het MLflow-modelregister.
- Probeer de nieuwe versie van het MLflow-model te leveren.
Voorbeeld van notitieblok
In het volgende notebook ziet u hoe u classificatie kunt uitvoeren met AutoML.
Voorbeeldnotitieblok voor AutoML-classificatie
Volgende stappen
Naslaginformatie over de AutoML Python-API.