Поделиться через


Использование scikit-learn в Azure Databricks

На этой странице приведены примеры использования scikit-learn пакета для обучения моделей машинного обучения в Azure Databricks. scikit-learn является одной из самых популярных библиотек Python для машинного обучения с одним узлом и включен в Databricks Runtime и Databricks Runtime ML. Сведения о том, какая версия библиотеки scikit-learn входит в среду выполнения вашего кластера, см. в заметках о выпуске Databricks Runtime.

Эти записные книжки можно импортировать и запустить в рабочей области Azure Databricks.

Дополнительные примеры блокнотов для быстрого освоения работы в Azure Databricks см. в разделе Руководства: Начало работы с ИИ и машинным обучением.

Базовый пример использования scikit-learn

В этой записной книжке представлен краткий обзор обучения моделей машинного обучения на Azure Databricks. Он использует scikit-learn пакет для обучения простой модели классификации. Он также иллюстрирует использование MLflow для отслеживания процесса разработки модели и Optuna для автоматизации настройки гиперпараметров.

Если в вашей рабочей области включен каталог Unity, используйте эту версию блокнота:

Нотбук классификации scikit-learn (каталог Unity)

Возьми тетрадь

Если ваша рабочая область не поддерживает Unity Catalog, используйте эту версию блокнота:

Записная книжка классификации scikit-learn

Возьми тетрадь

Полный пример использования scikit-learn в Azure Databricks

Эта записная книжка использует scikit-learn для иллюстрации полного комплексного примера загрузки данных, обучения модели, настройки распределенного гиперпараметра и вывода модели. Он также иллюстрирует управление жизненным циклом модели с помощью реестра моделей MLflow для регистрации и регистрации модели.

Если в вашей рабочей области включен каталог Unity, используйте эту версию блокнота:

Используйте scikit-learn с интеграцией MLflow в Databricks (Unity Catalog)

Возьми тетрадь

Если ваша рабочая область не поддерживает Unity Catalog, используйте эту версию блокнота:

Использование scikit-learn с интеграцией MLflow в Databricks

Возьми тетрадь