Общие сведения о том, когда следует настроить базовую модель

Завершено

С помощью предварительно обученных моделей основы с открытым исходным кодом можно сохранять ресурсы. Иногда может потребоваться точно настроить базовую модель для удовлетворения конкретных потребностей.

Изучение базовых моделей в каталоге моделей

Базовые модели — это большие модели машинного обучения, которые уже обучены служить основой для широкого спектра вариантов использования.

В Машинное обучение Azure можно изучить открытый код базовые модели, выполнив поиск по каталогу моделей. Какой тип базовой модели зависит от того, для чего требуется использовать модель.

Как правило, базовые модели обучены на больших объемах данных и excel при выполнении универсальных задач, таких как понимание языка, создание текста и прогнозирование контекста. Однако они могут быть не лучшим выбором, если вам нужна модель, адаптированная к определенной задаче или домену. В таких случаях вы можете точно настроить базовую модель для данных, относящихся к конкретным задачам, и добиться лучших результатов.

Точное настройка базовых моделей для конкретных задач

Хотя базовые модели уже могут соответствовать вашим требованиям, вам может потребоваться настроить базовую модель.

Базовые модели предварительно обучены в различных диапазонах текста из Интернета, что делает их опытным в общем понимании языка. Однако при точной настройке можно адаптировать знания модели к определенной задаче или домену, оптимизируя ее производительность и обеспечивая ее эффективность в этом конкретном контексте.

Ниже приведены некоторые распространенные задачи, для которых может потребоваться точно настроить базовую модель:

  • Классификация текста: классификация заданного текста в стандартные классы или категории на основе его содержимого или контекста.
  • Классификация маркеров: назначение определенных меток или тегов отдельным маркерам или словам в тексте, часто используемых в задачах, таких как распознавание именованных сущностей.
  • Ответ на вопросы: предоставление точных и соответствующих ответов на вопросы, задаваемые на естественном языке.
  • Сводка: создание кратких и согласованных сводок более длинных текстов, захват необходимых сведений.
  • Перевод: преобразование текста из одного языка в другой при сохранении значения и контекста.

Так как базовые модели уже предварительно обучены, вам нужен меньший набор данных для конкретной задачи для точной настройки базовой модели. При точной настройке модели вам, скорее всего, потребуется меньше данных и вычислений, чем при обучении модели с нуля.

Вы можете точно настроить базовую модель из каталога моделей в Машинное обучение Azure. Для точной настройки модели требуется только небольшой набор данных и кластер GPU.