Política de manutenção de modelos de IA generativa
Este artigo descreve a política de manutenção de modelo para as ofertas de pagamento por token e ajuste fino de APIs do Modelo de Base.
Para continuar a oferecer suporte aos modelos mais avançados, o Databricks pode atualizar os modelos suportados ou aposentar modelos mais antigos para as APIs do Foundation Model pay-per-token e as ofertas Foundation Model Fine-tuning.
Modelo de política de reforma
A política de desativação a seguir se aplica somente aos modelos de bate-papo e conclusão suportados nas ofertas de pagamento por token e ajuste fino do modelo Foundation Model.
Quando um modelo é aposentado, ele não está mais disponível para uso e é removido das ofertas de recursos indicadas. O Databricks executa as seguintes etapas para notificar os clientes sobre um modelo definido para desativação:
- Uma mensagem de aviso é exibida no cartão modelo da página Servindo do espaço de trabalho Databricks que indica que o modelo está planejado para a desativação.
- Uma mensagem de aviso é exibida no menu suspenso para Ajuste fino do modelo de base na guia Experimentos que indica que o modelo está planejado para desativação.
- A documentação aplicável contém um aviso que indica que o modelo está planejado para aposentadoria e a data de início em que ele não será mais suportado.
Depois que os usuários forem notificados sobre a próxima aposentadoria do modelo, a Databricks aposentará o modelo em três meses. Durante este período de três meses, os clientes podem:
- Opte por migrar para um ponto de extremidade de taxa de transferência provisionado para continuar usando o modelo após sua data de fim de vida útil
- Migre fluxos de trabalho existentes para usar modelos de substituição recomendados.
Na data de desativação, o modelo é removido do produto e a documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.
Consulte Modelos aposentados para obter uma lista de modelos atualmente aposentados e datas de aposentadoria planejadas.
Atualizações de modelo
O Databricks pode enviar atualizações incrementais para modelos de pagamento por token para fornecer otimizações. Quando um modelo é atualizado, a URL do ponto de extremidade permanece a mesma, mas a ID do modelo no objeto de resposta é alterada para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.1-405B
em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.1-405B-030424
. O Databricks mantém um histórico de versões das atualizações às quais você pode se referir.
Modelos aposentados
As seções a seguir resumem as desativações de modelo atuais e futuras para as ofertas de pagamento por token e ajuste fino do Modelo de Fundação das APIs do Modelo de Base.
Modelo de Fundação Ajuste fino de aposentadorias
A tabela a seguir mostra famílias modelo aposentadas, suas datas de aposentadoria e famílias de modelos de substituição recomendadas para uso em cargas de trabalho de ajuste fino do Modelo de Base. A Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de aposentadoria indicada.
Família de modelos | Data da reforma | Família de modelos de substituição recomendada |
---|---|---|
Meta-Lama-3 | Janeiro 7, 2025 | Meta-Lama-3,1 |
Meta-Lama-2 | Janeiro 7, 2025 | Meta-Lama-3,1 |
Código Llama | Janeiro 7, 2025 | Meta-Lama-3,1 |
Aposentadorias pagas por token de APIs do Modelo de Base
A tabela a seguir mostra as desativações de modelo, suas datas de aposentadoria e modelos de substituição recomendados a serem usados para cargas de trabalho de serviço de pagamento por token de APIs do Modelo de Base. A Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de aposentadoria indicada.
Importante
Em 11 de dezembro de 2024, o Meta-Llama-3.3-70B-Instruct substituiu o suporte para o Meta-Llama-3.1-70B-Instruct nos endpoints pay-per-token das APIs dos Modelos Fundamentais.
Modelo | Data da reforma | Modelo de substituição recomendado |
---|---|---|
Meta-Llama-3.1-70B-Instruir | 11 de dezembro de 2024 | Meta-Llama-3.3-70B-Instruct |
Meta-Llama-3-70B-Instruir | Julho 23, 2024 | Meta-Llama-3.1-70B-Instruir |
Meta-Lama-2-70B-Chat | 30 de outubro de 2024 | Meta-Llama-3.1-70B-Instruir |
MPT 7B Instruir | 30 de agosto de 2024 | Mixtral-8x7B |
MPT 30B Instruir | 30 de agosto de 2024 | Mixtral-8x7B |
Se você precisar de suporte de longo prazo para uma versão de modelo específica, o Databricks recomenda o uso da taxa de transferência provisionada de APIs do Modelo de Base para suas cargas de trabalho de serviço.