Поделиться через


Политика обслуживания генеративных моделей ИИ

В этой статье описывается политика обслуживания модели для API-интерфейсов Foundation Model с оплатой за каждый токен и предложения по тонкой подстройке Foundation Model .

Чтобы продолжать поддерживать передовые модели, Databricks может обновлять поддерживаемые модели или снимать с поддержки старые модели для API-интерфейсов базовых моделей с оплатой за токен и услуг настройки базовой модели.

Политика вывода модели из эксплуатации

Следующая политика выхода на пенсию применяется только к поддерживаемым моделям чата и завершения в API-интерфейсах модели Foundation за токен и предложения по настройке модели Foundation.

Если модель снята с эксплуатации, она больше недоступна для использования и удаляется из указанных наборов функций. Databricks выполняет следующие действия, чтобы уведомить клиентов о модели, запланированной к снятию с производства:

  • Предупреждающее сообщение отображается на карточке модели на странице сервиса вашей рабочей области Databricks, указывающее на то, что модель планируется к выводу из эксплуатации.
  • Предупреждающее сообщение отображается в раскрывающемся меню для настройки модели Foundation на вкладке "Эксперименты", указывая, что модель планируется снять с эксплуатации.
  • Соответствующая документация содержит уведомление, указывающее, что модель планируется выводиться из эксплуатации, и указывает дату, с которой поддержка будет прекращена.

После того как пользователи получат уведомление о предстоящем выводе модели из эксплуатации, Databricks прекратит использование модели через три месяца. В течение этого трехмесячного периода клиенты могут:

  • Выберите переход на подготовленную конечную точку пропускной способности, чтобы продолжить использование модели после даты окончания срока действия.
  • Перенос существующих рабочих процессов для использования рекомендуемых моделей замены.

На дату выхода на пенсию модель удаляется из продукта, и соответствующая документация обновляется, чтобы рекомендовать использовать модель замены.

См. Устаревшие модели для получения списка модели, которые уже устарели, и запланированных дат снятия с производства.

Обновления модели

Databricks может отправлять добавочные обновления в модели с оплатой за токен для обеспечения оптимизации. При обновлении модели URL-адрес конечной точки остается неизменным, но идентификатор модели в объекте отклика изменяется в соответствии с датой обновления. Например, если обновление пересылается в meta-llama/Meta-Llama-3.1-405B 3 апреля 2024 года, имя модели в объекте ответа обновляется до meta-llama/Meta-Llama-3.1-405B-030424. Databricks поддерживает журнал версий обновлений, на которые можно ссылаться.

устаревшие модели

В следующих разделах приведены сведения о текущих и предстоящих выводах из эксплуатации моделей для API интерфейсов базовых моделей с оплатой за токен и предложений по тонкой настройке базовых моделей.

Завершение доработки моделей Foundation

В следующей таблице показаны модели, снятые с производства, даты их снятия и рекомендуемые семейства моделей для использования в рабочих нагрузках, связанных с точной настройкой моделей Foundation. Databricks рекомендует перенести приложения на использование моделей замены до указанной даты прекращения использования.

Семейство моделей Дата выхода на пенсию Рекомендуемое семейство моделей замены
Мета-Лама-3 7 января 2025 г. Meta-Llama-3.1
Мета-Лама-2 7 января 2025 г. Meta-Llama-3.1
Код Лама 7 января 2025 г. Meta-Llama-3.1

Модель API Foundation на основе оплаты за токен по выводу из эксплуатации

В следующей таблице показаны выводы моделей из эксплуатации, даты их вывода и рекомендуемые модели для замены, которые используются для API Foundation Model, обслуживающих рабочие нагрузки с оплатой за токен. Databricks рекомендует перенести приложения на использование моделей замены до указанной даты прекращения использования.

Важный

11 декабря 2024 г. Meta-Llama-3.3-70B-Instruct заменил поддержку Meta-Llama-3.1-70B-Instruct в API Foundation Model в конечных точках оплаты за токен.

Модель Дата выхода на пенсию Рекомендуемая модель замены
Мета-Ллама-3.1-70B-Instruct 11 декабря 2024 г. Meta-Llama-3.3-70B-Instruct
Мета-Лама-3-70B-Instruct 23 июля 2024 г. Мета-Ллама-3.1-70B-Instruct
Meta-Llama-2-70B-Chat 30 октября 2024 г. Мета-Ллама-3.1-70B-Instruct
Инструкция MPT 7B 30 августа 2024 г. Mixtral-8x7B
Инструкции MPT 30B 30 августа 2024 г. Mixtral-8x7B

Если вам требуется долгосрочная поддержка для конкретной версии модели, Databricks рекомендует использовать API интерфейсы модели Foundation , предоставленную пропускную способность для ваших рабочих нагрузок обслуживания.