Partilhar via


Política de manutenção de modelos de IA generativa

Este artigo descreve a política de manutenção de modelo para as ofertas de pagamento por token e ajuste fino de APIs do Modelo de Base.

Para continuar a oferecer suporte aos modelos mais avançados, o Databricks pode atualizar os modelos suportados ou aposentar modelos mais antigos para as APIs do Foundation Model pay-per-token e as ofertas Foundation Model Fine-tuning.

Modelo de política de reforma

A política de desativação a seguir se aplica somente aos modelos de bate-papo e conclusão suportados nas ofertas de pagamento por token e ajuste fino do modelo Foundation Model.

Quando um modelo é aposentado, ele não está mais disponível para uso e é removido das ofertas de recursos indicadas. O Databricks executa as seguintes etapas para notificar os clientes sobre um modelo definido para desativação:

  • Uma mensagem de aviso é exibida no cartão modelo da página Servindo do espaço de trabalho Databricks que indica que o modelo está planejado para a desativação.
  • Uma mensagem de aviso é exibida no menu suspenso para Ajuste fino do modelo de base na guia Experimentos que indica que o modelo está planejado para desativação.
  • A documentação aplicável contém um aviso que indica que o modelo está planejado para aposentadoria e a data de início em que ele não será mais suportado.

Depois que os usuários forem notificados sobre a próxima aposentadoria do modelo, a Databricks aposentará o modelo em três meses. Durante este período de três meses, os clientes podem:

  • Opte por migrar para um ponto de extremidade de taxa de transferência provisionado para continuar usando o modelo após sua data de fim de vida útil
  • Migre fluxos de trabalho existentes para usar modelos de substituição recomendados.

Na data de desativação, o modelo é removido do produto e a documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.

Consulte Modelos aposentados para obter uma lista de modelos atualmente aposentados e datas de aposentadoria planejadas.

Atualizações de modelo

O Databricks pode enviar atualizações incrementais para modelos de pagamento por token para fornecer otimizações. Quando um modelo é atualizado, a URL do ponto de extremidade permanece a mesma, mas a ID do modelo no objeto de resposta é alterada para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.1-405B em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.1-405B-030424. O Databricks mantém um histórico de versões das atualizações às quais você pode se referir.

Modelos aposentados

As seções a seguir resumem as desativações de modelo atuais e futuras para as ofertas de pagamento por token e ajuste fino do Modelo de Fundação das APIs do Modelo de Base.

Modelo de Fundação Ajuste fino de aposentadorias

A tabela a seguir mostra famílias modelo aposentadas, suas datas de aposentadoria e famílias de modelos de substituição recomendadas para uso em cargas de trabalho de ajuste fino do Modelo de Base. A Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de aposentadoria indicada.

Família de modelos Data da reforma Família de modelos de substituição recomendada
Meta-Lama-3 Janeiro 7, 2025 Meta-Lama-3,1
Meta-Lama-2 Janeiro 7, 2025 Meta-Lama-3,1
Código Llama Janeiro 7, 2025 Meta-Lama-3,1

Aposentadorias pagas por token de APIs do Modelo de Base

A tabela a seguir mostra as desativações de modelo, suas datas de aposentadoria e modelos de substituição recomendados a serem usados para cargas de trabalho de serviço de pagamento por token de APIs do Modelo de Base. A Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de aposentadoria indicada.

Importante

Em 11 de dezembro de 2024, o Meta-Llama-3.3-70B-Instruct substituiu o suporte para o Meta-Llama-3.1-70B-Instruct nos endpoints pay-per-token das APIs dos Modelos Fundamentais.

Modelo Data da reforma Modelo de substituição recomendado
Meta-Llama-3.1-70B-Instruir 11 de dezembro de 2024 Meta-Llama-3.3-70B-Instruct
Meta-Llama-3-70B-Instruir Julho 23, 2024 Meta-Llama-3.1-70B-Instruir
Meta-Lama-2-70B-Chat 30 de outubro de 2024 Meta-Llama-3.1-70B-Instruir
MPT 7B Instruir 30 de agosto de 2024 Mixtral-8x7B
MPT 30B Instruir 30 de agosto de 2024 Mixtral-8x7B

Se você precisar de suporte de longo prazo para uma versão de modelo específica, o Databricks recomenda o uso da taxa de transferência provisionada de APIs do Modelo de Base para suas cargas de trabalho de serviço.