Sdílet prostřednictvím


Zásady údržby modelů generující AI

Tento článek popisuje zásady údržby modelu pro rozhraní API základního modelu s platbami za token a vyladění základních modelů.

Aby bylo možné pokračovat v podpoře většiny nejmodernějších modelů, může Databricks aktualizovat podporované modely nebo vyřadit starší modely pro rozhraní API základních modelů s platbami za token a nabídky jemného ladění modelu foundation.

Zásady vyřazení modelu

Následující zásady vyřazení se vztahují pouze na podporované modely chatu a dokončování v rozhraních API základního modelu s platbami za token a nabídky jemného ladění modelu foundation.

Když je model vyřazený, už není k dispozici pro použití a odebere se z uvedených nabídek funkcí. Databricks provede následující kroky, aby zákazníky informoval o modelu, který je nastavený pro vyřazení z provozu:

  • Na kartě modelu se na stránce Obsluha pracovního prostoru Databricks zobrazí zpráva s upozorněním, že se model plánuje pro vyřazení z provozu.
  • V rozevírací nabídce pro vyladění základního modelu na kartě Experimenty se zobrazí zpráva s upozorněním, že je model plánovaný pro vyřazení z provozu.
  • Příslušná dokumentace obsahuje oznámení, které indikuje, že model se plánuje pro vyřazení z provozu a datum zahájení už nebude podporováno.

Jakmile budou uživatelé upozorněni na nadcházející vyřazení modelu, Databricks model vyřadí do tří měsíců. Během tohoto tříměsíčního období můžou zákazníci:

  • Zvolte migraci na koncový bod zřízené propustnosti a pokračujte v používání modelu po datu ukončení životnosti.
  • Migrujte existující pracovní postupy tak, aby používaly doporučené náhradní modely.

K datu vyřazení se model z produktu odebere a příslušná dokumentace se aktualizuje, aby doporučila použití náhradního modelu.

Seznam aktuálně vyřazených modelů a plánovaných dat vyřazení modelů najdete v části Vyřazené modely.

Aktualizace modelu

Databricks může dodávat přírůstkové aktualizace modelů s platbami za tokeny za účelem poskytování optimalizací. Při aktualizaci modelu zůstane adresa URL koncového bodu stejná, ale ID modelu v objektu odpovědi se změní tak, aby odráželo datum aktualizace. Pokud je například aktualizace odeslána meta-llama/Meta-Llama-3.1-405B 4. 3. 2024, název modelu v objektu odpovědi se aktualizuje na meta-llama/Meta-Llama-3.1-405B-030424. Databricks udržuje historii verzí aktualizací, na které můžete odkazovat.

Vyřazené modely

Následující části shrnují aktuální a nadcházející vyřazení modelu pro rozhraní API základního modelu s platbami za token a nabídky jemného ladění modelu foundation.

Vyřazení základníhomodeluho

Následující tabulka uvádí vyřazené rodiny modelů, jejich data vyřazení a doporučené náhradní rodiny modelů, které se mají použít pro úlohy vyladění základního modelu. Databricks doporučuje migrovat aplikace tak, aby používaly náhradní modely před uvedeným datem vyřazení.

Řada modelů Datum vyřazení Doporučená řada náhradních modelů
Meta-Llama-3 7. ledna 2025 Meta-Llama-3.1
Meta-Llama-2 7. ledna 2025 Meta-Llama-3.1
Kód Llama 7. ledna 2025 Meta-Llama-3.1

Vyřazení rozhraní API základního modelu s platbami za token

Následující tabulka uvádí vyřazení modelu, data vyřazení z provozu a doporučené náhradní modely, které se mají použít pro rozhraní API základních modelů s platbami za tokeny obsluhující úlohy. Databricks doporučuje migrovat aplikace tak, aby používaly náhradní modely před uvedeným datem vyřazení.

Důležité

Dne 11. prosince 2024 nahradila meta-llama-3.3-70B-Instruct podporu pro koncové body Meta-Llama-3.1-70B-Instruct in Foundation Model APIs pay-per-token.

Model Datum vyřazení Doporučený náhradní model
Meta-Llama-3.1-70B-Instruct 11. prosince 2024 Meta-Llama-3.3-70B-Instruct
Meta-Llama-3-70B-Instruct 23. července 2024 Meta-Llama-3.1-70B-Instruct
Meta-Llama-2-70B-Chat 30. října 2024 Meta-Llama-3.1-70B-Instruct
MPT 7B – pokyn 30. srpna 2024 Mixtral-8x7B
MPT 30B – pokyn 30. srpna 2024 Mixtral-8x7B

Pokud potřebujete dlouhodobou podporu pro konkrétní verzi modelu, doporučuje Databricks používat rozhraní API základního modelu zřízenou propustnost pro vaše obsluhované úlohy.