Compartilhar via


Política de manutenção de modelos de IA generativa

Este artigo descreve a política de manutenção do modelo para as APIs do Foundation Model e as ofertas de ajuste fino do Foundation Model.

Para continuar dando suporte aos modelos mais avançados, a Databricks pode atualizar modelos com suporte ou desativar modelos mais antigos para as APIs do Modelo de Base de pagamento por token e ofertas de ajuste fino do Modelo de Base.

Política de desativação de modelo

A política de desativação a seguir se aplica somente aos modelos de chat e conclusão compatíveis nas ofertas de pagamento por token e ajuste fino do Foundation Model APIs do Foundation Model.

Quando um modelo é retirado, ele não está mais disponível para uso e é removido das ofertas de recursos indicadas. O Databricks executa as seguintes etapas para notificar os clientes sobre um modelo definido para desativação:

  • Uma mensagem de aviso é exibida no cartão de modelo da página de Serviço do workspace do Databricks que indica que o modelo será desativado.
  • Uma mensagem de aviso é exibida no menu suspenso para Ajuste fino do modelo de base na guia Experimentos que indica que o modelo está planejado para desativação.
  • A documentação aplicável contém um aviso que indica que o modelo está planejado para desativação e a data de início em que ele não será mais suportado.

Depois que os usuários forem notificados sobre a próxima desativação do modelo, a Databricks desativará o modelo em três meses. Durante esse período de três meses, os clientes podem:

  • Opte por migrar para um ponto de extremidade de taxa de transferência provisionada para continuar usando o modelo após a data de fim da vida útil
  • Migre fluxos de trabalho existentes para usar modelos de substituição recomendados.

Na data de desativação, o modelo é removido do produto e a documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.

Consulte Modelos aposentados para obter uma lista de modelos atualmente desativados e datas de aposentadoria planejadas.

Atualizações de modelo

O Databricks pode enviar atualizações incrementais para modelos de pagamento por token para fornecer otimizações. Quando um modelo é atualizado, a URL do ponto de extremidade permanece a mesma, mas a ID do modelo no objeto de resposta é alterada para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.1-405B em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.1-405B-030424. O Databricks mantém um histórico de versões das atualizações às quais os clientes podem se referir.

Modelos desativados

As seções a seguir resumem as desativações de modelo atuais e futuras para as APIs do Foundation Model Ofertas de pagamento por token e ajuste fino do Foundation Model.

Modelo de Fundação Ajustando as aposentadorias

A tabela a seguir mostra as famílias de modelos descontinuados, suas datas de desativação e as famílias de modelos de substituição recomendadas a serem usadas para cargas de trabalho de ajuste fino do modelo de base. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.

Família do modelo Data de baixa Família do modelo de substituição recomendado
Meta Llama-3 13 de dezembro de 2024 Meta Llama-3.1
Meta Llama-2 13 de dezembro de 2024 Meta Llama-3.1
Code Llama 13 de dezembro de 2024 Meta Llama-3.1

Desativações do pagamento por token das APIs do modelo base

A tabela a seguir mostra as desativações de modelos, suas datas de desativação e os modelos de substituição recomendados a serem usados para cargas de trabalho de serviço de pagamento por token das APIs de Modelos Fundamentais. O Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de desativação indicada.

Importante

A partir de 23 de julho de 2024, o Meta-Llama-3.1-70B-Instruct substitui o suporte para Meta-Llama-3-70B-Instruct nos pontos de extremidade de pagamento por token das APIs do modelo base.

Modelar Data de baixa Modelo de substituição recomendado
Meta-Llama-3-70B-Instruct 23 de julho de 2024 Meta-Llama-3.1-70B-Instruct
Meta-Llama-2-70B-Chat 30 de outubro de 2024 Meta-Llama-3.1-70B-Instruct
MPT 7B Instruct 30 de agosto de 2024 Mixtral-8x7B
MPT 30B Instruct 30 de agosto de 2024 Mixtral-8x7B

Se você precisar de suporte de longo prazo para uma versão de modelo específica, o Databricks recomenda usar a taxa de transferência provisionada de APIs do Modelo de Fundação para suas cargas de trabalho de serviço.