Trenowanie modeli klasyfikacji przy użyciu interfejsu API języka Python rozwiązania AutoML

Artykuł
01/21/2025

W tym artykule pokazano, jak wytrenować model za pomocą rozwiązania AutoML przy użyciu interfejsu API języka Python w języku AutoML. Aby uzyskać więcej informacji, zobacz Dokumentację interfejsu API języka Python rozwiązania AutoML.

Interfejs API udostępnia funkcje umożliwiające rozpoczęcie klasyfikacji, regresji i prognozowania przebiegów automatycznego uczenia maszynowego. Każde wywołanie funkcji trenuje zestaw modeli i generuje notatnik testowy dla każdego modelu.

Zobacz Wymagania dotyczące eksperymentów rozwiązania AutoML.

Konfigurowanie eksperymentu przy użyciu interfejsu API rozwiązania AutoML

W poniższych krokach ogólnie opisano sposób konfigurowania eksperymentu zautomatyzowanego uczenia maszynowego przy użyciu interfejsu API:

Utwórz notes i dołącz go do klastra z uruchomioną usługą Databricks Runtime ML.
Zidentyfikuj tabelę, której chcesz użyć z istniejącego źródła danych lub przekazać plik danych do systemu plików DBFS i utworzyć tabelę.
Aby uruchomić uruchamianie automatycznego uczenia maszynowego, użyj funkcji automl.regress(), automl.classify()lub automl.forecast() i przekaż tabelę wraz z innymi parametrami trenowania. Aby wyświetlić wszystkie funkcje i parametry, zobacz odniesienie do interfejsu API języka Python.

Uwaga

Funkcja automl.forecast() jest dostępna tylko do prognozowania w przypadku klasycznych obliczeń.

Na przykład:
```
# Regression example
summary = automl.regress(dataset=train_pdf, target_col="col_to_predict")

# Classification example
summary = automl.classification(dataset=train_pdf, target_col="col_to_predict")

# Forecasting example
summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")
```
Po rozpoczęciu uruchamiania rozwiązania AutoML w konsoli pojawi się adres URL eksperymentu MLflow. Użyj tego adresu URL, aby monitorować postęp przebiegu. Odśwież eksperyment MLflow, aby zobaczyć próby po ich zakończeniu.
Po zakończeniu działania rozwiązania AutoML:

Użyj linków w podsumowaniu danych wyjściowych, aby przejść do eksperymentu MLflow lub notesu, który wygenerował najlepsze wyniki.
Użyj linku do notesu eksploracji danych, aby uzyskać wgląd w dane przekazane do rozwiązania AutoML. Możesz również dołączyć ten notes do tego samego klastra i uruchomić go ponownie, aby odtworzyć wyniki lub przeprowadzić dodatkową analizę danych.
Użyj obiektu podsumowania zwróconego z wywołania rozwiązania AutoML, aby zapoznać się z bardziej szczegółowymi informacjami na temat prób lub załadować model wytrenowany przez daną wersję próbną. Dowiedz się więcej o obiekcie AutoMLSummary.
Sklonuj dowolny wygenerowany notes z wersji próbnej i uruchom go ponownie, dołączając go do tego samego klastra, aby odtworzyć wyniki. Możesz również wprowadzić niezbędne zmiany, uruchomić je ponownie, aby wytrenować dodatkowe modele i zalogować je do tego samego eksperymentu.

Importowanie notesu

Aby zaimportować notes zapisany jako artefakt MLflow, użyj interfejsu databricks.automl.import_notebook API języka Python. Aby uzyskać więcej informacji, zobacz Importowanie notesu

Rejestrowanie i wdrażanie modelu

Możesz wdrożyć i zarejestrować model wytrenowany przy użyciu AutoML tak samo, jak każdy zarejestrowany model w rejestrze modeli MLflow; zobacz Dziennik, ładowanie i rejestrowanie modeli MLflow.

Brak modułu o nazwie `pandas.core.indexes.numeric`

Podczas obsługi modelu utworzonego przy użyciu rozwiązania AutoML z obsługą modelu może wystąpić błąd: No module named pandas.core.indexes.numeric.

Jest to spowodowane niezgodną pandas wersją między rozwiązaniem AutoML a modelem obsługującym środowisko punktu końcowego. Aby naprawić ten błąd:

Pobierz skrypt add-pandas-dependency.py. Skrypt edytuje element requirements.txt i conda.yaml dla zarejestrowanego modelu, aby zawierał odpowiednią pandas wersję zależności: pandas==1.5.3.
Zmodyfikuj skrypt, aby uwzględnić identyfikator run_id przebiegu MLflow, w którym zarejestrowano model.
Ponowne wyrejestrowanie modelu do rejestru modeli MLflow.
Spróbuj użyć nowej wersji modelu MLflow.

Przykład notesu

W poniższym notesie pokazano, jak przeprowadzić klasyfikację za pomocą rozwiązania AutoML.

Przykładowy notes klasyfikacji automatycznego uczenia maszynowego

Pobierz notes

Następne kroki

Dokumentacja interfejsu API języka Python rozwiązania AutoML.

Udostępnij za pośrednictwem

Trenowanie modeli klasyfikacji przy użyciu interfejsu API języka Python rozwiązania AutoML

Konfigurowanie eksperymentu przy użyciu interfejsu API rozwiązania AutoML

Importowanie notesu

Rejestrowanie i wdrażanie modelu

Brak modułu o nazwie `pandas.core.indexes.numeric`

Przykład notesu

Przykładowy notes klasyfikacji automatycznego uczenia maszynowego

Następne kroki

Opinia

Dodatkowe zasoby

Udostępnij za pośrednictwem

Trenowanie modeli klasyfikacji przy użyciu interfejsu API języka Python rozwiązania AutoML

Konfigurowanie eksperymentu przy użyciu interfejsu API rozwiązania AutoML

Importowanie notesu

Rejestrowanie i wdrażanie modelu

Brak modułu o nazwie pandas.core.indexes.numeric

Przykład notesu

Przykładowy notes klasyfikacji automatycznego uczenia maszynowego

Następne kroki

Opinia

Dodatkowe zasoby

Brak modułu o nazwie `pandas.core.indexes.numeric`