Zásady údržby modelů generující AI
Tento článek popisuje zásady údržby modelu pro rozhraní API základních modelů s platem za token a jemné doladění základního modelu nabídky.
Aby bylo možné pokračovat v podpoře většiny nejmodernějších modelů, Databricks může update podporované modely nebo vyřadit starší modely pro rozhraní API základních modelů s platbou za token a nabídky pro doladění základních modelů.
Zásady vyřazování modelu
Zásady ukončení uvedené níže se vztahují pouze na podporované modely chatu a dokončování v rozhraních API základního modelu v nabídkách platby za token a jemného ladění základního modelu.
Když je model vyřazený, už není k dispozici pro použití a odebere se z uvedených nabídek funkcí. Databricks provede následující kroky, aby zákazníky informoval o modelu, který je set pro vyřazení z provozu:
- Na kartě modelu na stránce Obsluha pracovního prostoru Databricks se zobrazí upozornění, že model bude vyřazen z provozu.
- V rozevírací nabídce pro vyladění základního modelu na kartě Experimenty se zobrazí zpráva s upozorněním, že je model plánovaný pro vyřazení z provozu.
- Příslušná dokumentace obsahuje oznámení, které uvádí, že model je plánován k vyřazení z provozu, a datum, ke kterému již nebude podporován.
Jakmile budou uživatelé upozorněni na nadcházející vyřazení modelu, Databricks model vyřadí do tří měsíců. Během tohoto tříměsíčního období můžou zákazníci:
- Zvolte migraci na koncový bod zřízené propustnosti a pokračujte v používání modelu po datu ukončení životnosti.
- Migrujte existující pracovní postupy tak, aby používaly doporučené náhradní modely.
K datu vyřazení se model z produktu odebere a příslušná dokumentace se aktualizuje, aby doporučila použití náhradního modelu.
V tématu Vyřazené modelylist aktuálně vyřazených modelů a plánovaných dat vyřazení.
Aktualizace modelu
Databricks může dodávat přírůstkové aktualizace modelů s platbami za tokeny za účelem poskytování optimalizací. Při aktualizaci modelu zůstane adresa URL koncového bodu stejná, ale ID modelu v objektu odpovědi se změní tak, aby odráželo datum update. Pokud je například update odeslán do meta-llama/Meta-Llama-3.1-405B
3. 4. 2024, název modelu v objektu odpovědi se aktualizuje na meta-llama/Meta-Llama-3.1-405B-030424
. Databricks udržuje historii verzí aktualizací, na které můžete odkazovat.
vyřazené modely
Následující části shrnují aktuální a nadcházející ukončení modelu pro rozhraní API nadace modelu s platbami za token a nabídky jemného ladění nadace modelu.
Vyřazení základního modelu
Následující table ukazuje vyřazené rodiny modelů, jejich data vyřazení a doporučené náhradní rodiny modelů, které se mají použít pro úlohy vyladění základního modelu. Databricks doporučuje migrovat aplikace tak, aby používaly náhradní modely před uvedeným datem vyřazení.
Modelová rodina | Datum vyřazení | Doporučená řada náhradních modelů |
---|---|---|
Meta-Llama-3 | 7. ledna 2025 | Meta-Llama-3.1 |
Meta-Llama-2 | 7. ledna 2025 | Meta-Llama-3.1 |
Kód Llama | 7. ledna 2025 | Meta-Llama-3.1 |
Ukončení rozhraní API základního modelu s platbami za token
Následující table ukazuje vyřazení modelů, jejich data vyřazení a doporučené náhradní modely, které se mají použít pro rozhraní API základních modelů, sloužící k úlohám účtovaným na základě platby za token. Databricks doporučuje migrovat aplikace tak, aby používaly náhradní modely před uvedeným datem vyřazení.
Důležitý
Dne 11. prosince 2024 Meta-Llama-3.3-70B-Instruct nahradil podporu Meta-Llama-3.1-70B-Instruct v koncových bodech pro Foundation Model APIs s platbou za token.
Model | Datum vyřazení | Doporučený náhradní model |
---|---|---|
Meta-Llama-3.1-70B-Instruct | 11. prosince 2024 | Meta-Llama-3.3-70B-Instruct |
Meta-Llama-3-70B-Instruct | 23. července 2024 | Meta-Llama-3.1-70B-Instruct |
Meta-Llama-2-70B-Chat | 30. října 2024 | Meta-Llama-3.1-70B-Instruct |
MPT 7B – Instruujte | 30. srpna 2024 | Mixtral-8x7B |
MPT 30B – pokyn | 30. srpna 2024 | Mixtral-8x7B |
Pokud potřebujete dlouhodobou podporu pro konkrétní verzi modelu, databricks doporučuje používat rozhraní API základního modelu zřízenou propustnost pro vaše obsluhované úlohy.