Política de manutenção de modelos de IA generativa
Este artigo descreve a política de manutenção de modelo para as de pagamento por token das APIs do
Para continuar a oferecer suporte aos modelos mais avançados, o Databricks pode update modelos suportados ou aposentar modelos mais antigos para as APIs do Foundation Model pay-per-token e as ofertas Foundation Model Fine-tuning.
Modelo de política de aposentadoria
A política de desativação a seguir se aplica somente aos modelos de bate-papo e conclusão suportados nas ofertas de pagamento por token e ajuste fino do modelo Foundation Model.
Quando um modelo é aposentado, ele não está mais disponível para uso e é removido das ofertas de recursos indicadas. A Databricks executa as seguintes etapas para notificar os clientes sobre um modelo que está marcado como set para obsolescência:
- Uma mensagem de aviso é exibida no cartão modelo na página Serving do seu espaço de trabalho Databricks que indica que o modelo está planejado para a desativação.
- Uma mensagem de aviso é exibida no menu suspenso para Ajuste fino do modelo de base na guia Experimentos que indica que o modelo está planejado para desativação.
- A documentação aplicável contém um aviso que indica que o modelo está planeado para aposentação e a data a partir da qual não será mais suportado.
Depois que os usuários forem notificados sobre a próxima aposentadoria do modelo, a Databricks aposentará o modelo em três meses. Durante este período de três meses, os clientes podem:
- Opte por migrar para um ponto de extremidade de taxa de transferência provisionado para continuar usando o modelo após sua data de fim de vida útil
- Migre fluxos de trabalho existentes para usar modelos de substituição recomendados.
Na data de desativação, o modelo é removido do produto e a documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.
Consulte Modelos aposentados para obter uma list dos modelos atualmente aposentados e datas de aposentadoria planejadas.
Atualizações de modelo
O Databricks pode enviar atualizações incrementais para modelos de pagamento por token para fornecer otimizações. Quando um modelo é atualizado, a URL do ponto de extremidade permanece a mesma, mas a ID do modelo no objeto de resposta é alterada para refletir a data do update. Por exemplo, se um update for enviado para meta-llama/Meta-Llama-3.1-405B
em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.1-405B-030424
. O Databricks mantém um histórico de versões das atualizações às quais você pode se referir.
Modelos aposentados
As secções seguintes resumem as aposentações de modelos atuais e futuras para as ofertas das APIs de Modelos Fundamentais de pagamento por token e ajuste fino.
Modelo de Fundação Ajuste fino de aposentadorias
A table a seguir mostra famílias modelo aposentadas, suas datas de aposentadoria e famílias de modelos de substituição recomendadas para uso em cargas de trabalho de ajuste fino do Modelo de Base. A Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de aposentadoria indicada.
Família de modelos | Data da reforma | Família de modelos de substituição recomendada |
---|---|---|
Meta-Lama-3 | Janeiro 7, 2025 | Meta-Lama-3,1 |
Meta-Lama-2 | Janeiro 7, 2025 | Meta-Lama-3,1 |
Código Llama | Janeiro 7, 2025 | Meta-Lama-3,1 |
Aposentadorias pagas por token de APIs do Modelo de Base
A table a seguir mostra os modelos descontinuados, as datas de descontinuação e os modelos de substituição recomendados para serem usados em cargas de trabalho das APIs de Modelos Fundamentais pagas por token. A Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de aposentadoria indicada.
Importante
Em 11 de dezembro de 2024, o Meta-Llama-3.3-70B-Instruct substituiu o suporte ao Meta-Llama-3.1-70B-Instruct nos endpoints pagos por token das APIs do Foundation Model.
Modelo | Data da reforma | Modelo de substituição recomendado |
---|---|---|
Meta-Llama-3.1-70B-Instruct | 11 de dezembro de 2024 | Meta-Llama-3.3-70B-Instruir |
Meta-Llama-3-70B-Instruct | Julho 23, 2024 | Meta-Llama-3.1-70B-Instruct |
Meta-Lama-2-70B-Chat | 30 de outubro de 2024 | Meta-Llama-3.1-70B-Instruct |
MPT 7B Instruir | 30 de agosto de 2024 | Mixtral-8x7B |
MPT 30B Instruir | 30 de agosto de 2024 | Mixtral-8x7B |
Se precisar de suporte de longo prazo para uma versão específica do modelo, a Databricks recomenda utilizar APIs de Modelo Fundamental com taxa de transferência provisionada para os seus workloads de serviço.