Примеры обучения моделей
В этом разделе приведены примеры обучения моделей машинного обучения в Azure Databricks с помощью многих популярных библиотек с открытым кодом.
Вы также можете использовать AutoML, который автоматически подготавливает набор данных для обучения модели, выполняет набор пробных версий с помощью библиотек с открытым исходным кодом, таких как scikit-learn и XGBoost, и создает записную книжку Python с исходным кодом для каждого пробного запуска, чтобы вы могли просматривать, воспроизводить и изменять код.
Примеры Машинного обучения
Пакет | Записные книжки | Функции |
---|---|---|
scikit-learn | Руководство по машинному обучению | Каталог Unity, модель классификации, MLflow, автоматическая настройка гиперпараметра с помощью Hyperopt и MLflow |
scikit-learn | Полный пример | Каталог Unity, модель классификации, MLflow, автоматическая настройка гиперпараметров с помощью Hyperopt и MLflow, XGBoost |
MLlib | Примеры MLlib | Двоичная классификация, деревья принятия решений, регрессия GBT, структурированная потоковая передача, настраиваемый преобразователь |
XGBoost | Примеры XGBoost | Python, PySpark и Scala, а также рабочие нагрузки с одним узлом и распределенное обучение |
Пример настройки гиперпараметров
Общие сведения о настройке гиперпараметров в Azure Databricks см. в статье Настройка гиперпараметров.
Пакет | Записная книжка | Функции |
---|---|---|
Optuna | Начало работы с Optuna | Optuna, распределенная Optuna, scikit-learn, MLflow |
Hyperopt | Распределенная функция Hyperopt | Распределенная функция Hyperopt, scikit-learn, MLflow |
Hyperopt | Сравнение моделей | Одновременный поиск моделей разных типов в пространстве гиперпараметров с помощью распределенной функции Hyperopt |
Hyperopt | Алгоритмы распределенного обучения и Hyperopt | Hyperopt, MLlib |
Hyperopt | Рекомендации по Hyperopt | Рекомендации для наборов данных разного размера |