Поделиться через


Обучение моделей регрессии с помощью API Python AutoML

В этой статье показано, как обучить модель с помощью AutoML с помощью API Python AutoML. Дополнительные сведения см . в справочнике по API Python AutoML.

API предоставляет функции для запуска классификации, регрессии и прогнозирования запусков AutoML. Каждый вызов функции обучает набор моделей и создает пробную записную книжку для каждой модели.

См . требования к экспериментам AutoML.

Настройка эксперимента с помощью API AutoML

В следующих шагах обычно описывается настройка эксперимента AutoML с помощью API:

  1. Создайте записную книжку и подключите ее к кластеру под управлением Databricks Runtime ML.

  2. Определите таблицу, которую вы хотите использовать из существующего источника данных или отправьте файл данных в DBFS и создайте таблицу.

  3. Чтобы запустить autoML, используйте automl.regress()automl.classify()функцию или функцию и automl.forecast() передайте таблицу вместе с другими параметрами обучения. Дополнительные сведения о всех функциях и параметрах см . в справочнике по API Python AutoML.

    Примечание.

    Функция automl.forecast() доступна только для прогнозирования классических вычислений.

    Например:

    # Regression example
    summary = automl.regress(dataset=train_pdf, target_col="col_to_predict")
    
    # Classification example
    summary = automl.classification(dataset=train_pdf, target_col="col_to_predict")
    
    # Forecasting example
    summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")
    
  4. После начала выполнения AutoML в консоли появляется URL-адрес эксперимента MLflow. Используйте этот URL-адрес для мониторинга хода выполнения. Обновите эксперимент MLflow, чтобы просмотреть пробные запуски по мере их завершения.

  5. После завершения выполнения AutoML сделайте следующее.

  • Используйте ссылки в сводке выходных данных, чтобы перейти к эксперименту MLflow или записной книжке, создающей лучшие результаты.
  • Используйте ссылку на записную книжку для изучения данных, чтобы получить аналитические сведения о данных, передаваемых в AutoML. Вы также можете подключить эту записную книжку к тому же кластеру и повторно запустить ее, чтобы воспроизвести результаты или выполнить дополнительный анализ данных.
  • Используйте сводный объект, возвращенный из вызова AutoML, чтобы получить дополнительные сведения об испытаниях или загрузить модель, обученную данным пробным запуском. Дополнительные сведения об объекте AutoMLSummary.
  • Клонируйте любую созданную записную книжку из пробных версий и повторно запустите ее, подключив ее к одному кластеру, чтобы воспроизвести результаты. Вы также можете внести необходимые изменения, повторно запустить их для обучения дополнительных моделей и войти в тот же эксперимент.

Импорт записной книжки

Чтобы импортировать записную книжку, сохраненную в качестве артефакта MLflow, используйте databricks.automl.import_notebook API Python. Дополнительные сведения см. в разделе "Импорт записной книжки"

Регистрация и развертывание модели

Вы можете зарегистрировать и развернуть обученную модель AutoML так же, как и любую зарегистрированную модель в реестре моделей MLflow; см. журнал, загрузка и регистрация моделей MLflow.

Без имени модуля pandas.core.indexes.numeric

При обслуживании модели, созданной с помощью AutoML с обслуживанием моделей, может возникнуть ошибка: No module named pandas.core.indexes.numeric

Это связано с несовместимой pandas версией между AutoML и средой конечной точки обслуживания модели. Чтобы устранить эту ошибку, сделайте следующее:

  1. Скачайте скрипт add-pandas-dependency.py. Скрипт изменяет requirements.txt и conda.yaml для модели журнала, чтобы включить соответствующую pandas версию зависимостей: pandas==1.5.3
  2. Измените скрипт, чтобы включить run_id запуск MLflow, в котором была зарегистрирована модель.
  3. Перерегистрировать модель в реестре моделей MLflow.
  4. Попробуйте использовать новую версию модели MLflow.

Пример записной книжки

В следующей записной книжке показано, как выполнить регрессию с помощью AutoML.

Пример записной книжки регрессии AutoML

Получить записную книжку

Следующие шаги

Справочник по API Python AutoML.