Stratégie de maintenance des modèles d’IA générative
Cet article décrit la stratégie de maintenance de modèle pour les API Foundation Model pay-per token et Foundation Model Fine-tunings .
Afin de continuer à prendre en charge les modèles les plus avancés, Databricks peut mettre à jour les modèles pris en charge ou mettre hors service les modèles plus anciens pour les API de modèle Foundation pour les offres de paiement par jeton et d’optimisation du modèle Foundation Model.
Stratégie de mise hors service du modèle
La stratégie de mise hors service suivante s’applique uniquement aux modèles de conversation et d’achèvement pris en charge dans les API Foundation Model pay-per token et Foundation Model Fine-tunings.
Lorsqu’un modèle est mis hors service, il n’est plus disponible pour une utilisation et est supprimé des offres de fonctionnalités indiquées. Databricks effectue les étapes suivantes pour informer les clients d’un modèle défini pour la mise hors service :
- Un message d’avertissement s’affiche dans la carte du modèle de la page Service de votre espace de travail Databricks, indiquant qu’il est prévu de mettre le modèle hors service.
- Un message d’avertissement s’affiche dans le menu déroulant pour le réglage précis du modèle Foundation dans l’onglet Expériences qui indique que le modèle est planifié pour la mise hors service.
- La documentation applicable contient un avis indiquant que le modèle est planifié pour la mise hors service et la date de début qu’il ne sera plus pris en charge.
Une fois que les utilisateurs sont informés de la mise hors service du modèle à venir, Databricks met le modèle hors service en trois mois. Pendant cette période de trois mois, les clients peuvent :
- Choisir de migrer vers un point de terminaison de débit provisionné pour continuer à utiliser le modèle après sa date de fin de vie
- Migrez les flux de travail existants pour utiliser les modèles de remplacement recommandés.
À la date de mise hors service, le modèle est supprimé du produit et la documentation applicable est mise à jour pour recommander l’utilisation d’un modèle de remplacement.
Consultez Modèles supprimés pour obtenir la liste des modèles actuellement mis hors service et des dates de mise hors service prévues.
Mises à jour de modèle
Databricks peut expédier des mises à jour incrémentielles aux modèles de paiement par jeton pour fournir des optimisations. Lorsqu’un modèle est mis à jour, l’URL du point de terminaison reste la même, mais l’ID de modèle dans l’objet de réponse change pour refléter la date de la mise à jour. Par exemple, si une mise à jour est livrée à meta-llama/Meta-Llama-3.1-405B
le 04/03/2024, le nom du modèle dans l’objet de réponse est mis à jour et devient meta-llama/Meta-Llama-3.1-405B-030424
. Databricks gère un historique des versions des mises à jour auxquelles vous pouvez vous référer.
Modèles supprimés
Les sections suivantes résument les retraits actuels et à venir des modèles pour les API Foundation Model pay-per-token et Foundation Model Fine-tunings.
Retraits de réglage fin du modèle de base
Le tableau suivant présente les familles de modèles supprimées, leurs dates de mise hors service et les familles de modèles de remplacement recommandées à utiliser pour les charges de travail de réglage précis du modèle Foundation. Databricks vous recommande de migrer vos applications pour utiliser des modèles de remplacement avant la date de mise hors service indiquée.
Famille de modèles | Date de mise hors service | Famille de modèles de remplacement recommandée |
---|---|---|
Meta Llama-3 | 13 décembre 2024 | Meta Llama-3.1 |
Meta Llama-2 | 13 décembre 2024 | Meta Llama-3.1 |
Code Llama | 13 décembre 2024 | Meta Llama-3.1 |
Mise hors service du paiement par jeton API Foundation Model
Le tableau suivant présente les mises hors service des modèles, leurs dates de mise hors service et les modèles de remplacement qu’il est recommandé d’utiliser le service de charges de paiement par jeton des API Foundation Model. Databricks vous recommande de migrer vos applications pour utiliser des modèles de remplacement avant la date de mise hors service indiquée.
Important
Le 23 juillet 2024, Meta-Llama-3.1-70B-Instruct a remplacé la prise en charge de Meta-Llama-3-70B-Instruct dans les points de terminaison de paiement par jeton des API Foundation Model.
Modèle | Date de mise hors service | Modèle de remplacement recommandé |
---|---|---|
Meta-Llama-3-70B-Instruct | 23 juillet 2024 | Meta-Llama-3.1-70B-Instruct |
Meta-Llama-2-70B-Chat | 30 octobre 2024 | Meta-Llama-3.1-70B-Instruct |
MPT 7B Instruct | 30 août 2024 | Mixtral-8x7B |
MPT 30B Instruct | 30 août 2024 | Mixtral-8x7B |
Si vous avez besoin d’une prise en charge à long terme d’une version de modèle spécifique, Databricks recommande d’utiliser le débit approvisionné des API Foundation Model pour vos charges de travail de service.