Поделиться через


Обучение моделей искусственного интеллекта и машинного обучения

В этом разделе показано, как обучить модели машинного обучения и ИИ в Мозаике ИИ.

Обучение модели ИИ мозаики упрощает процесс обучения и развертывания традиционных моделей машинного обучения с помощью autoML и базовых рабочих нагрузок точной настройки модели.

AutoML

AutoML упрощает процесс применения машинного обучения к наборам данных, автоматически найдя оптимальный алгоритм и конфигурацию гиперпараметров. AutoML предлагает пользовательский интерфейс без кода, а также API Python.

Тонкое настройка модели Foundation

Базовая настройка модели (в настоящее время часть обучения модели Мозаичного ИИ) в Databricks позволяет настраивать большие языковые модели (LLMs) с помощью собственных данных. Этот процесс включает в себя точное обучение предварительно существующей базовой модели, значительно уменьшая объем данных, времени и вычислительных ресурсов, необходимых по сравнению с обучением модели с нуля. Ключевые возможности:

  • Защищенная настройка. Адаптация модели к новым задачам путем обучения структурированным данным ответа с запросом.
  • Продолжающееся предварительное обучение. Улучшение модели с дополнительными текстовыми данными для добавления новых знаний или фокуса на определенном домене.
  • Завершение чата: обучение модели в журналах чата для улучшения возможностей общения.

Примеры библиотеки с открытым кодом

Ознакомьтесь с примерами обучения машинного обучения из различных библиотек машинного обучения открытый код, включая примеры настройки гиперпараметров с помощью Optuna и Hyperopt.

Глубокое обучение

Ознакомьтесь с примерами и рекомендациями по распределенному обучению глубокого обучения, чтобы вы могли разрабатывать и настраивать модели глубокого обучения в Azure Databricks.

Рекомендации

Узнайте, как обучать модели рекомендаций на основе глубокого обучения в Azure Databricks. По сравнению с традиционными моделями рекомендаций модели глубокого обучения могут достичь более качественных результатов и масштабирования до больших объемов данных.