Política de manutenção de modelos de IA generativa
Este artigo descreve a política de manutenção do modelo para as APIs do Foundation Model e as ofertas de ajuste fino do Foundation Model.
Para continuar dando suporte aos modelos mais avançados, a Databricks pode atualizar modelos com suporte ou desativar modelos mais antigos para as APIs do Modelo de Base de pagamento por token e ofertas de ajuste fino do Modelo de Base.
Política de desativação de modelo
A política de desativação a seguir se aplica somente aos modelos de chat e conclusão compatíveis nas ofertas de pagamento por token e ajuste fino do Foundation Model APIs do Foundation Model.
Quando um modelo é retirado, ele não está mais disponível para uso e é removido das ofertas de recursos indicadas. O Databricks executa as seguintes etapas para notificar os clientes sobre um modelo definido para desativação:
- Uma mensagem de aviso é exibida no cartão de modelo da página de Serviço do workspace do Databricks que indica que o modelo será desativado.
- Uma mensagem de aviso é exibida no menu suspenso para Ajuste fino do modelo de base na guia Experimentos que indica que o modelo está planejado para desativação.
- A documentação aplicável contém um aviso que indica que o modelo está planejado para desativação e a data de início em que ele não será mais suportado.
Depois que os usuários forem notificados sobre a próxima desativação do modelo, a Databricks desativará o modelo em três meses. Durante esse período de três meses, os clientes podem:
- Opte por migrar para um ponto de extremidade de taxa de transferência provisionada para continuar usando o modelo após a data de fim da vida útil
- Migre fluxos de trabalho existentes para usar modelos de substituição recomendados.
Na data de desativação, o modelo é removido do produto e a documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.
Consulte Modelos aposentados para obter uma lista de modelos atualmente desativados e datas de aposentadoria planejadas.
Atualizações de modelo
O Databricks pode enviar atualizações incrementais para modelos de pagamento por token para fornecer otimizações. Quando um modelo é atualizado, a URL do ponto de extremidade permanece a mesma, mas a ID do modelo no objeto de resposta é alterada para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.1-405B
em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.1-405B-030424
. O Databricks mantém um histórico de versões das atualizações às quais os clientes podem se referir.
Modelos desativados
As seções a seguir resumem as desativações de modelo atuais e futuras para as APIs do Foundation Model Ofertas de pagamento por token e ajuste fino do Foundation Model.
Modelo de Fundação Ajustando as aposentadorias
A tabela a seguir mostra as famílias de modelos descontinuados, suas datas de desativação e as famílias de modelos de substituição recomendadas a serem usadas para cargas de trabalho de ajuste fino do modelo de base. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.
Família do modelo | Data de baixa | Família do modelo de substituição recomendado |
---|---|---|
Meta Llama-3 | 13 de dezembro de 2024 | Meta Llama-3.1 |
Meta Llama-2 | 13 de dezembro de 2024 | Meta Llama-3.1 |
Code Llama | 13 de dezembro de 2024 | Meta Llama-3.1 |
Desativações do pagamento por token das APIs do modelo base
A tabela a seguir mostra as desativações de modelos, suas datas de desativação e os modelos de substituição recomendados a serem usados para cargas de trabalho de serviço de pagamento por token das APIs de Modelos Fundamentais. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.
Importante
A partir de 23 de julho de 2024, o Meta-Llama-3.1-70B-Instruct substitui o suporte para Meta-Llama-3-70B-Instruct nos pontos de extremidade de pagamento por token das APIs do modelo base.
Modelar | Data de baixa | Modelo de substituição recomendado |
---|---|---|
Meta-Llama-3-70B-Instruct | 23 de julho de 2024 | Meta-Llama-3.1-70B-Instruct |
Meta-Llama-2-70B-Chat | 30 de outubro de 2024 | Meta-Llama-3.1-70B-Instruct |
MPT 7B Instruct | 30 de agosto de 2024 | Mixtral-8x7B |
MPT 30B Instruct | 30 de agosto de 2024 | Mixtral-8x7B |
Se você precisar de suporte de longo prazo para uma versão de modelo específica, o Databricks recomenda usar a taxa de transferência provisionada de APIs do Modelo de Fundação para suas cargas de trabalho de serviço.