Partilhar via


Política de manutenção de modelos de IA generativa

Este artigo descreve a política de manutenção de modelo para as de pagamento por token das APIs do Foundation Model e as ofertas de de ajuste fino do Foundation Model.

Para continuar a oferecer suporte aos modelos mais avançados, o Databricks pode update modelos suportados ou aposentar modelos mais antigos para as APIs do Foundation Model pay-per-token e as ofertas Foundation Model Fine-tuning.

Modelo de política de aposentadoria

A política de desativação a seguir se aplica somente aos modelos de bate-papo e conclusão suportados nas ofertas de pagamento por token e ajuste fino do modelo Foundation Model.

Quando um modelo é aposentado, ele não está mais disponível para uso e é removido das ofertas de recursos indicadas. A Databricks executa as seguintes etapas para notificar os clientes sobre um modelo que está marcado como set para obsolescência:

  • Uma mensagem de aviso é exibida no cartão modelo na página Serving do seu espaço de trabalho Databricks que indica que o modelo está planejado para a desativação.
  • Uma mensagem de aviso é exibida no menu suspenso para Ajuste fino do modelo de base na guia Experimentos que indica que o modelo está planejado para desativação.
  • A documentação aplicável contém um aviso que indica que o modelo está planeado para aposentação e a data a partir da qual não será mais suportado.

Depois que os usuários forem notificados sobre a próxima aposentadoria do modelo, a Databricks aposentará o modelo em três meses. Durante este período de três meses, os clientes podem:

  • Opte por migrar para um ponto de extremidade de taxa de transferência provisionado para continuar usando o modelo após sua data de fim de vida útil
  • Migre fluxos de trabalho existentes para usar modelos de substituição recomendados.

Na data de desativação, o modelo é removido do produto e a documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.

Consulte Modelos aposentados para obter uma list dos modelos atualmente aposentados e datas de aposentadoria planejadas.

Atualizações de modelo

O Databricks pode enviar atualizações incrementais para modelos de pagamento por token para fornecer otimizações. Quando um modelo é atualizado, a URL do ponto de extremidade permanece a mesma, mas a ID do modelo no objeto de resposta é alterada para refletir a data do update. Por exemplo, se um update for enviado para meta-llama/Meta-Llama-3.1-405B em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.1-405B-030424. O Databricks mantém um histórico de versões das atualizações às quais você pode se referir.

Modelos aposentados

As secções seguintes resumem as aposentações de modelos atuais e futuras para as ofertas das APIs de Modelos Fundamentais de pagamento por token e ajuste fino.

Modelo de Fundação Ajuste fino de aposentadorias

A table a seguir mostra famílias modelo aposentadas, suas datas de aposentadoria e famílias de modelos de substituição recomendadas para uso em cargas de trabalho de ajuste fino do Modelo de Base. A Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de aposentadoria indicada.

Família de modelos Data da reforma Família de modelos de substituição recomendada
Meta-Lama-3 Janeiro 7, 2025 Meta-Lama-3,1
Meta-Lama-2 Janeiro 7, 2025 Meta-Lama-3,1
Código Llama Janeiro 7, 2025 Meta-Lama-3,1

Aposentadorias pagas por token de APIs do Modelo de Base

A table a seguir mostra os modelos descontinuados, as datas de descontinuação e os modelos de substituição recomendados para serem usados em cargas de trabalho das APIs de Modelos Fundamentais pagas por token. A Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de aposentadoria indicada.

Importante

Em 11 de dezembro de 2024, o Meta-Llama-3.3-70B-Instruct substituiu o suporte ao Meta-Llama-3.1-70B-Instruct nos endpoints pagos por token das APIs do Foundation Model.

Modelo Data da reforma Modelo de substituição recomendado
Meta-Llama-3.1-70B-Instruct 11 de dezembro de 2024 Meta-Llama-3.3-70B-Instruir
Meta-Llama-3-70B-Instruct Julho 23, 2024 Meta-Llama-3.1-70B-Instruct
Meta-Lama-2-70B-Chat 30 de outubro de 2024 Meta-Llama-3.1-70B-Instruct
MPT 7B Instruir 30 de agosto de 2024 Mixtral-8x7B
MPT 30B Instruir 30 de agosto de 2024 Mixtral-8x7B

Se precisar de suporte de longo prazo para uma versão específica do modelo, a Databricks recomenda utilizar APIs de Modelo Fundamental com taxa de transferência provisionada para os seus workloads de serviço.