Underhållsprincip för generativa AI-modeller
Den här artikeln beskriver modellunderhållsprincipen för API:erna för Foundation Model betala per token och Grundmodell Finjusteringserbjudanden .
För att fortsätta att stödja de mest toppmoderna modellerna kan Databricks uppdatera modeller som stöds eller dra tillbaka äldre modeller för Foundation Model-API:erna pay-per-token och Foundation Model Fine-tuning-erbjudanden.
Modellavdragningsprincip
Följande pensionsprincip gäller endast för chatt- och slutförandemodeller som stöds i FOUNDATION Model API:erna pay-per-token och Foundation Model Fine-tuning-erbjudanden.
När en modell dras tillbaka är den inte längre tillgänglig för användning och tas bort från de angivna funktionserbjudandena. Databricks vidtar följande steg för att meddela kunderna om en modell som har angetts för pensionering:
- Ett varningsmeddelande visas i modellkortet från sidan Servering på databricks-arbetsytan som anger att modellen är planerad att tas ur bruk.
- Ett varningsmeddelande visas i den nedrullningsbara menyn för Foundation Model Fine-tuning på fliken Experiment som anger att modellen är planerad att dras tillbaka.
- Den tillämpliga dokumentationen innehåller ett meddelande som anger att modellen är planerad att tas bort och att startdatumet inte längre stöds.
När användarna meddelas om den kommande modellavgången kommer Databricks att dra tillbaka modellen om tre månader. Under den här tremånadersperioden kan kunderna antingen:
- Välj att migrera till en etablerad dataflödesslutpunkt för att fortsätta använda modellen efter dess slutdatum
- Migrera befintliga arbetsflöden för att använda rekommenderade ersättningsmodeller.
På slutdatumet tas modellen bort från produkten och tillämplig dokumentation uppdateras för att rekommendera användning av en ersättningsmodell.
Se Tillbakadragna modeller för en lista över för närvarande tillbakadragna modeller och planerade pensionsdatum.
Modelluppdateringar
Databricks kan leverera inkrementella uppdateringar av betala per token-modeller för att leverera optimeringar. När en modell uppdateras förblir slutpunkts-URL:en densamma, men modell-ID:t i svarsobjektet ändras för att återspegla datumet för uppdateringen. Om en uppdatering till exempel levereras till meta-llama/Meta-Llama-3.1-405B
den 3/4/2024 uppdateras modellnamnet i svarsobjektet till meta-llama/Meta-Llama-3.1-405B-030424
. Databricks har en versionshistorik över de uppdateringar som du kan referera till.
Tillbakadragna modeller
I följande avsnitt sammanfattas aktuella och kommande modellavgångar för Foundation Model-API:erna pay-per-token och Foundation Model Fine-tuning-erbjudanden.
Finjustering av grundmodell
I följande tabell visas pensionerade modellfamiljer, deras pensionsdatum och rekommenderade ersättningsmodellfamiljer som ska användas för arbetsbelastningar med finjustering av foundation-modell. Databricks rekommenderar att du migrerar dina program för att använda ersättningsmodeller före angivet slutdatum.
Modellfamilj | Pensionsdatum | Rekommenderad ersättningsmodellfamilj |
---|---|---|
Meta-Llama-3 | den 13 december 2024 | Meta-Llama-3.1 |
Meta-Llama-2 | den 13 december 2024 | Meta-Llama-3.1 |
Kod-llama | den 13 december 2024 | Meta-Llama-3.1 |
Foundation Model-API:er betalar per token-pensionering
Följande tabell visar modellavgångar, deras pensionsdatum och rekommenderade ersättningsmodeller som ska användas för FOUNDATION Model API:er som betalar per token och betjänar arbetsbelastningar. Databricks rekommenderar att du migrerar dina program för att använda ersättningsmodeller före angivet slutdatum.
Viktigt!
Den 23 juli 2024 ersatte Meta-Llama-3.1-70B-Instruct stöd för Meta-Llama-3-70B-Instruct i Foundation Model API:er betala per token-slutpunkter.
Modell | Pensionsdatum | Rekommenderad ersättningsmodell |
---|---|---|
Meta-Llama-3-70B-Instruct | den 23 juli 2024 | Meta-Llama-3.1-70B-Instruct |
Meta-Llama-2-70B-Chat | den 30 oktober 2024 | Meta-Llama-3.1-70B-Instruct |
MPT 7B-instruktion | 30 augusti 2024 | Mixtral-8x7B |
MPT 30B-instruktion | 30 augusti 2024 | Mixtral-8x7B |
Om du behöver långsiktigt stöd för en specifik modellversion rekommenderar Databricks att du använder API:er för Foundation Model-etablerade dataflöden för dina betjänande arbetsbelastningar.