Trenowanie modeli klasyfikacji przy użyciu interfejsu API języka Python rozwiązania AutoML
W tym artykule pokazano, jak wytrenować model za pomocą rozwiązania AutoML przy użyciu interfejsu API języka Python w języku AutoML. Aby uzyskać więcej informacji, zobacz Dokumentację interfejsu API języka Python rozwiązania AutoML.
Interfejs API udostępnia funkcje umożliwiające rozpoczęcie klasyfikacji, regresji i prognozowania przebiegów automatycznego uczenia maszynowego. Każde wywołanie funkcji trenuje zestaw modeli i generuje notatnik testowy dla każdego modelu.
Zobacz Wymagania dotyczące eksperymentów rozwiązania AutoML.
Konfigurowanie eksperymentu przy użyciu interfejsu API rozwiązania AutoML
W poniższych krokach ogólnie opisano sposób konfigurowania eksperymentu zautomatyzowanego uczenia maszynowego przy użyciu interfejsu API:
Utwórz notes i dołącz go do klastra z uruchomioną usługą Databricks Runtime ML.
Zidentyfikuj tabelę, której chcesz użyć z istniejącego źródła danych lub przekazać plik danych do systemu plików DBFS i utworzyć tabelę.
Aby uruchomić uruchamianie automatycznego uczenia maszynowego, użyj funkcji
automl.regress()
,automl.classify()
lubautoml.forecast()
i przekaż tabelę wraz z innymi parametrami trenowania. Aby wyświetlić wszystkie funkcje i parametry, zobacz odniesienie do interfejsu API języka Python.Uwaga
Funkcja
automl.forecast()
jest dostępna tylko do prognozowania w przypadku klasycznych obliczeń.Na przykład:
# Regression example summary = automl.regress(dataset=train_pdf, target_col="col_to_predict") # Classification example summary = automl.classification(dataset=train_pdf, target_col="col_to_predict") # Forecasting example summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")
Po rozpoczęciu uruchamiania rozwiązania AutoML w konsoli pojawi się adres URL eksperymentu MLflow. Użyj tego adresu URL, aby monitorować postęp przebiegu. Odśwież eksperyment MLflow, aby zobaczyć próby po ich zakończeniu.
Po zakończeniu działania rozwiązania AutoML:
- Użyj linków w podsumowaniu danych wyjściowych, aby przejść do eksperymentu MLflow lub notesu, który wygenerował najlepsze wyniki.
- Użyj linku do notesu eksploracji danych, aby uzyskać wgląd w dane przekazane do rozwiązania AutoML. Możesz również dołączyć ten notes do tego samego klastra i uruchomić go ponownie, aby odtworzyć wyniki lub przeprowadzić dodatkową analizę danych.
- Użyj obiektu podsumowania zwróconego z wywołania rozwiązania AutoML, aby zapoznać się z bardziej szczegółowymi informacjami na temat prób lub załadować model wytrenowany przez daną wersję próbną. Dowiedz się więcej o obiekcie AutoMLSummary.
- Sklonuj dowolny wygenerowany notes z wersji próbnej i uruchom go ponownie, dołączając go do tego samego klastra, aby odtworzyć wyniki. Możesz również wprowadzić niezbędne zmiany, uruchomić je ponownie, aby wytrenować dodatkowe modele i zalogować je do tego samego eksperymentu.
Importowanie notesu
Aby zaimportować notes zapisany jako artefakt MLflow, użyj interfejsu databricks.automl.import_notebook
API języka Python. Aby uzyskać więcej informacji, zobacz Importowanie notesu
Rejestrowanie i wdrażanie modelu
Możesz wdrożyć i zarejestrować model wytrenowany przy użyciu AutoML tak samo, jak każdy zarejestrowany model w rejestrze modeli MLflow; zobacz Dziennik, ładowanie i rejestrowanie modeli MLflow.
Brak modułu o nazwie pandas.core.indexes.numeric
Podczas obsługi modelu utworzonego przy użyciu rozwiązania AutoML z obsługą modelu może wystąpić błąd: No module named pandas.core.indexes.numeric
.
Jest to spowodowane niezgodną pandas
wersją między rozwiązaniem AutoML a modelem obsługującym środowisko punktu końcowego. Aby naprawić ten błąd:
-
Pobierz skrypt add-pandas-dependency.py.
Skrypt edytuje element
requirements.txt
iconda.yaml
dla zarejestrowanego modelu, aby zawierał odpowiedniąpandas
wersję zależności:pandas==1.5.3
. - Zmodyfikuj skrypt, aby uwzględnić identyfikator
run_id
przebiegu MLflow, w którym zarejestrowano model. - Ponowne wyrejestrowanie modelu do rejestru modeli MLflow.
- Spróbuj użyć nowej wersji modelu MLflow.
Przykład notesu
W poniższym notesie pokazano, jak przeprowadzić klasyfikację za pomocą rozwiązania AutoML.
Przykładowy notes klasyfikacji automatycznego uczenia maszynowego
Następne kroki
Dokumentacja interfejsu API języka Python rozwiązania AutoML.