Поделиться через


Настройка моделей с помощью Azure AI Foundry

Внимание

Элементы, обозначенные в этой статье как (предварительная версия), сейчас предлагаются в общедоступной предварительной версии. Эта предварительная версия предоставляется без соглашения об уровне обслуживания, и мы не рекомендуем ее для рабочих нагрузок. Некоторые функции могут не поддерживаться или их возможности могут быть ограничены. Дополнительные сведения см. в статье Дополнительные условия использования Предварительных версий Microsoft Azure.

Предварительная настройка относится к настройке предварительно обученной модели генерированного ИИ с дополнительным обучением по определенной задаче или новому набору данных для повышения производительности, новых навыков или повышения точности. Результатом является новая пользовательская модель GenAI, оптимизированная на основе приведенных примеров.

Рассмотрите возможность точной настройки моделей GenAI следующими способами:

  • Масштабирование и адаптация к конкретным потребностям предприятия
  • Сокращение ложных срабатываний, так как адаптированные модели менее вероятно, что они могут создавать неточные или неуместные ответы
  • Повышение точности модели для задач, относящихся к домену
  • Экономия времени и ресурсов с более быстрыми и точными результатами
  • Получение более релевантных результатов и результатов с учетом контекста, так как модели настраиваются для конкретных вариантов использования

Azure AI Foundry предлагает несколько моделей в разных поставщиках моделей, что позволяет получить доступ к последним и величайшим на рынке. Поддерживаемые модели для точной настройки можно найти в нашем каталоге моделей с помощью фильтра задач точной настройки и выбора карточки модели, чтобы узнать подробные сведения о каждой модели. Конкретные модели могут подвергаться региональным ограничениям, см. в этом списке дополнительные сведения.

Снимок экрана: каталог моделей Azure AI Foundry и фильтрация по задачам точной настройки.

В этой статье описаны варианты использования для точной настройки и как это поможет вам в пути GenAI.

Начало работы с тонкой настройкой

При запуске на пути создания искусственного интеллекта рекомендуется начать с разработки запросов и RAG, чтобы ознакомиться с базовыми моделями и ее возможностями.

  • Проектирование запросов — это метод, который включает проектирование запросов с использованием сведений о тоне и стиле, примерах ответов и сопоставлении намерений для моделей обработки естественного языка. Этот процесс повышает точность и релевантность в ответах, чтобы оптимизировать производительность модели.
  • Получение дополненного поколения (RAG) повышает производительность LLM, извлекая данные из внешних источников и включив их в запрос. RAG может помочь предприятиям достичь настраиваемых решений при сохранении релевантности данных и оптимизации затрат.

По мере того как вы получаете комфортное и начинаете строить свое решение, важно понять, где разработка запросов не хватает, и это поможет вам понять, следует ли попробовать точно настроить.

  • Происходит ли сбой базовой модели в пограничных случаях или исключениях?
  • Не является ли базовая модель согласованной предоставлением выходных данных в правильном формате?
  • Трудно ли указать достаточно примеров в окне контекста, чтобы управлять моделью?
  • Существует ли высокая задержка?

Примеры сбоев с базовой моделью и проектированием запросов помогут определить данные для сбора данных для точной настройки и установить базовые показатели производительности, с которыми можно оценить и сравнить настроенную модель. Наличие базовых показателей производительности без точной настройки важно знать, повышает ли производительность модели.

Приведем пример:

Клиент хочет использовать GPT-3.5 Turbo, чтобы превратить вопросы естественного языка в запросы в конкретный нестандартный язык запросов. Клиент предоставляет рекомендации в запросе (Always return GQL) и использует RAG для получения схемы базы данных. Однако синтаксис не всегда правильный и часто завершается ошибкой для пограничных вариантов. Клиент собирает тысячи примеров вопросов естественного языка и эквивалентных запросов к базе данных, включая случаи сбоя модели. Затем клиент использует эти данные для точной настройки модели. Объединение новой точно настроенной модели с инженерным запросом и получением обеспечивает точность выходных данных модели до допустимых стандартов для использования.

Случаи использования

Базовые модели уже предварительно обучены на огромных объемах данных, и в большинстве случаев вы добавите инструкции и примеры в запрос, чтобы получить ответы на качество, которые вы ищете, — этот процесс называется "несколько выстрелов обучения". Точную настройку позволяет обучать модель с множеством дополнительных примеров, которые можно адаптировать для удовлетворения конкретного варианта использования, таким образом улучшая процесс обучения с несколькими выстрелами. Это может снизить количество маркеров в запросе, что приведет к потенциальной экономии затрат и запросов с меньшей задержкой.

Преобразование естественного языка в язык запросов — это всего лишь один вариант использования, в котором невозможно показать модель поведения. Ниже приведены некоторые дополнительные варианты использования:

  • Улучшение обработки полученных данных модели
  • Модель управления для вывода содержимого в определенном стиле, тоне или формате
  • Повышение точности при поиске сведений
  • Уменьшение длины запроса
  • Обучение новым навыкам (т. е. естественному языку для кода)

Если вы определяете стоимость как основной мотиватор, будьте осторожны. Точное настройка может снизить затраты для определенных вариантов использования, сокращая запросы или позволяя использовать меньшую модель. Но может быть более высокая стоимость обучения, и вам придется платить за размещение собственной пользовательской модели.

Шаги по точной настройке модели

Ниже приведены общие шаги по настройке модели:

  1. В зависимости от варианта использования выберите модель, которая поддерживает вашу задачу.
  2. Подготовка данных для обучения
  3. (Необязательно) Подготовка и отправка данных проверки
  4. (Необязательно) Настройка параметров задачи
  5. Обучайте свою модель.
  6. После завершения просмотрите метрики и оцените модель. Если результаты не соответствуют вашему тесту, вернитесь к шагу 2.
  7. Использование точно настроенной модели

Важно отметить, что тонкой настройки сильно зависит от качества данных, которые можно предоставить. Рекомендуется предоставить сотни, если не тысячи, примеры обучения, чтобы быть успешными и получить нужные результаты.

Поддерживаемые модели для точной настройки

Теперь, когда вы знаете, когда следует использовать настройку для вашего варианта использования, вы можете перейти в Azure AI Foundry, чтобы найти модели, доступные для точной настройки. Для некоторых моделей в каталоге моделей можно точно настроить с помощью бессерверного API или управляемого вычисления (предварительная версия) или обоих.

Для некоторых моделей, развернутых с помощью бессерверных API, можно настроить определенные регионы Azure. Для точной настройки таких моделей пользователь должен иметь концентратор или проект в регионе, где модель доступна для точной настройки. Подробные сведения см. в разделе "Доступность регионов" для моделей в конечных точках API без сервера.

Дополнительные сведения о тонкой настройке с помощью управляемых вычислений (предварительная версия) см. в статье "Точное настройка моделей с помощью управляемых вычислений (предварительная версия)".

Дополнительные сведения о моделях Azure OpenAI, доступных для точной настройки, см . в документации по моделям Azure OpenAI или таблице моделей Azure OpenAI далее в этом руководстве.

Для моделей службы Azure OpenAI, которые можно настроить, поддерживаемые регионы для точной настройки включают северную часть США, Центральную Швецию и многое другое.

Настройка моделей Azure OpenAI

Примечание.

gpt-35-turbo — Настройка этой модели ограничена подмножеством регионов и недоступна в каждом регионе, где доступна базовая модель.

Поддерживаемые регионы для точной настройки могут отличаться, если вы используете модели Azure OpenAI в проекте Azure AI Foundry и вне проекта.

Model ID Точное настройка регионов Максимальный запрос (токены) Учебные данные (до)
babbage-002 Северная часть США
Центральная Швеция
Западная Швейцария
16,384 Сентябрь 2021 г.
davinci-002 Северная часть США
Центральная Швеция
Западная Швейцария
16,384 Сентябрь 2021 г.
gpt-35-turbo (0613) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
4096 Сентябрь 2021 г.
gpt-35-turbo (1106) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
Входные данные: 16 385
Выходные данные: 4096
Сентябрь 2021 г.
gpt-35-turbo (0125) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
16,385 Сентябрь 2021 г.
gpt-4 (0613) 1 Северная часть США
Центральная Швеция
8192 Сентябрь 2021 г.
gpt-4o-mini (2024-07-18) Северная часть США
Центральная Швеция
Входные данные: 128 000
Выходные данные: 16 384
Длина контекста примера обучения: 64 536
Октябрь 2023 г.
gpt-4o (2024-08-06) Восточная часть США2
Северная часть США
Центральная Швеция
Входные данные: 128 000
Выходные данные: 16 384
Длина контекста примера обучения: 64 536
Октябрь 2023 г.

1 GPT-4 в настоящее время находится в общедоступной предварительной версии.