Zásady údržby modelů generující AI
Tento článek popisuje zásady údržby modelu pro rozhraní API základního modelu s platbami za token a vyladění základních modelů.
Aby bylo možné pokračovat v podpoře většiny nejmodernějších modelů, může Databricks aktualizovat podporované modely nebo vyřadit starší modely pro rozhraní API základních modelů s platbami za token a nabídky jemného ladění modelu foundation.
Zásady vyřazení modelu
Následující zásady vyřazení se vztahují pouze na podporované modely chatu a dokončování v rozhraních API základního modelu s platbami za token a nabídky jemného ladění modelu foundation.
Když je model vyřazený, už není k dispozici pro použití a odebere se z uvedených nabídek funkcí. Databricks provede následující kroky, aby zákazníky informoval o modelu, který je nastavený pro vyřazení z provozu:
- Na kartě modelu se na stránce Obsluha pracovního prostoru Databricks zobrazí zpráva s upozorněním, že se model plánuje pro vyřazení z provozu.
- V rozevírací nabídce pro vyladění základního modelu na kartě Experimenty se zobrazí zpráva s upozorněním, že je model plánovaný pro vyřazení z provozu.
- Příslušná dokumentace obsahuje oznámení, které indikuje, že model se plánuje pro vyřazení z provozu a datum zahájení už nebude podporováno.
Jakmile budou uživatelé upozorněni na nadcházející vyřazení modelu, Databricks model vyřadí do tří měsíců. Během tohoto tříměsíčního období můžou zákazníci:
- Zvolte migraci na koncový bod zřízené propustnosti a pokračujte v používání modelu po datu ukončení životnosti.
- Migrujte existující pracovní postupy tak, aby používaly doporučené náhradní modely.
K datu vyřazení se model z produktu odebere a příslušná dokumentace se aktualizuje, aby doporučila použití náhradního modelu.
Seznam aktuálně vyřazených modelů a plánovaných dat vyřazení modelů najdete v části Vyřazené modely.
Aktualizace modelu
Databricks může dodávat přírůstkové aktualizace modelů s platbami za tokeny za účelem poskytování optimalizací. Při aktualizaci modelu zůstane adresa URL koncového bodu stejná, ale ID modelu v objektu odpovědi se změní tak, aby odráželo datum aktualizace. Pokud je například aktualizace odeslána meta-llama/Meta-Llama-3.1-405B
4. 3. 2024, název modelu v objektu odpovědi se aktualizuje na meta-llama/Meta-Llama-3.1-405B-030424
. Databricks udržuje historii verzí aktualizací, na které můžete odkazovat.
Vyřazené modely
Následující části shrnují aktuální a nadcházející vyřazení modelu pro rozhraní API základního modelu s platbami za token a nabídky jemného ladění modelu foundation.
Vyřazení základníhomodeluho
Následující tabulka uvádí vyřazené rodiny modelů, jejich data vyřazení a doporučené náhradní rodiny modelů, které se mají použít pro úlohy vyladění základního modelu. Databricks doporučuje migrovat aplikace tak, aby používaly náhradní modely před uvedeným datem vyřazení.
Řada modelů | Datum vyřazení | Doporučená řada náhradních modelů |
---|---|---|
Meta-Llama-3 | 7. ledna 2025 | Meta-Llama-3.1 |
Meta-Llama-2 | 7. ledna 2025 | Meta-Llama-3.1 |
Kód Llama | 7. ledna 2025 | Meta-Llama-3.1 |
Vyřazení rozhraní API základního modelu s platbami za token
Následující tabulka uvádí vyřazení modelu, data vyřazení z provozu a doporučené náhradní modely, které se mají použít pro rozhraní API základních modelů s platbami za tokeny obsluhující úlohy. Databricks doporučuje migrovat aplikace tak, aby používaly náhradní modely před uvedeným datem vyřazení.
Důležité
Dne 11. prosince 2024 nahradila meta-llama-3.3-70B-Instruct podporu pro koncové body Meta-Llama-3.1-70B-Instruct in Foundation Model APIs pay-per-token.
Model | Datum vyřazení | Doporučený náhradní model |
---|---|---|
Meta-Llama-3.1-70B-Instruct | 11. prosince 2024 | Meta-Llama-3.3-70B-Instruct |
Meta-Llama-3-70B-Instruct | 23. července 2024 | Meta-Llama-3.1-70B-Instruct |
Meta-Llama-2-70B-Chat | 30. října 2024 | Meta-Llama-3.1-70B-Instruct |
MPT 7B – pokyn | 30. srpna 2024 | Mixtral-8x7B |
MPT 30B – pokyn | 30. srpna 2024 | Mixtral-8x7B |
Pokud potřebujete dlouhodobou podporu pro konkrétní verzi modelu, doporučuje Databricks používat rozhraní API základního modelu zřízenou propustnost pro vaše obsluhované úlohy.