Обучение моделей регрессии с помощью API Python AutoML
В этой статье показано, как обучить модель с помощью AutoML с помощью API Python AutoML. Дополнительные сведения см . в справочнике по API Python AutoML.
API предоставляет функции для запуска классификации, регрессии и прогнозирования запусков AutoML. Каждый вызов функции обучает набор моделей и создает пробную записную книжку для каждой модели.
См . требования к экспериментам AutoML.
Настройка эксперимента с помощью API AutoML
В следующих шагах обычно описывается настройка эксперимента AutoML с помощью API:
Создайте записную книжку и подключите ее к кластеру под управлением Databricks Runtime ML.
Определите таблицу, которую вы хотите использовать из существующего источника данных или отправьте файл данных в DBFS и создайте таблицу.
Чтобы запустить autoML, используйте
automl.regress()
automl.classify()
функцию или функцию иautoml.forecast()
передайте таблицу вместе с другими параметрами обучения. Дополнительные сведения о всех функциях и параметрах см . в справочнике по API Python AutoML.Примечание.
Функция
automl.forecast()
доступна только для прогнозирования классических вычислений.Например:
# Regression example summary = automl.regress(dataset=train_pdf, target_col="col_to_predict") # Classification example summary = automl.classification(dataset=train_pdf, target_col="col_to_predict") # Forecasting example summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")
После начала выполнения AutoML в консоли появляется URL-адрес эксперимента MLflow. Используйте этот URL-адрес для мониторинга хода выполнения. Обновите эксперимент MLflow, чтобы просмотреть пробные запуски по мере их завершения.
После завершения выполнения AutoML сделайте следующее.
- Используйте ссылки в сводке выходных данных, чтобы перейти к эксперименту MLflow или записной книжке, создающей лучшие результаты.
- Используйте ссылку на записную книжку для изучения данных, чтобы получить аналитические сведения о данных, передаваемых в AutoML. Вы также можете подключить эту записную книжку к тому же кластеру и повторно запустить ее, чтобы воспроизвести результаты или выполнить дополнительный анализ данных.
- Используйте сводный объект, возвращенный из вызова AutoML, чтобы получить дополнительные сведения об испытаниях или загрузить модель, обученную данным пробным запуском. Дополнительные сведения об объекте AutoMLSummary.
- Клонируйте любую созданную записную книжку из пробных версий и повторно запустите ее, подключив ее к одному кластеру, чтобы воспроизвести результаты. Вы также можете внести необходимые изменения, повторно запустить их для обучения дополнительных моделей и войти в тот же эксперимент.
Импорт записной книжки
Чтобы импортировать записную книжку, сохраненную в качестве артефакта MLflow, используйте databricks.automl.import_notebook
API Python. Дополнительные сведения см. в разделе "Импорт записной книжки"
Регистрация и развертывание модели
Вы можете зарегистрировать и развернуть обученную модель AutoML так же, как и любую зарегистрированную модель в реестре моделей MLflow; см. журнал, загрузка и регистрация моделей MLflow.
Без имени модуля pandas.core.indexes.numeric
При обслуживании модели, созданной с помощью AutoML с обслуживанием моделей, может возникнуть ошибка: No module named pandas.core.indexes.numeric
Это связано с несовместимой pandas
версией между AutoML и средой конечной точки обслуживания модели. Чтобы устранить эту ошибку, сделайте следующее:
-
Скачайте скрипт add-pandas-dependency.py.
Скрипт изменяет
requirements.txt
иconda.yaml
для модели журнала, чтобы включить соответствующуюpandas
версию зависимостей:pandas==1.5.3
- Измените скрипт, чтобы включить
run_id
запуск MLflow, в котором была зарегистрирована модель. - Перерегистрировать модель в реестре моделей MLflow.
- Попробуйте использовать новую версию модели MLflow.
Пример записной книжки
В следующей записной книжке показано, как выполнить регрессию с помощью AutoML.
Пример записной книжки регрессии AutoML
Следующие шаги
Справочник по API Python AutoML.