Sdílet prostřednictvím


Zásady údržby modelů generující AI

Tento článek popisuje zásady údržby modelu pro rozhraní API základních modelů s platem za token a jemné doladění základního modelu nabídky.

Aby bylo možné pokračovat v podpoře většiny nejmodernějších modelů, Databricks může update podporované modely nebo vyřadit starší modely pro rozhraní API základních modelů s platbou za token a nabídky pro doladění základních modelů.

Zásady vyřazování modelu

Zásady ukončení uvedené níže se vztahují pouze na podporované modely chatu a dokončování v rozhraních API základního modelu v nabídkách platby za token a jemného ladění základního modelu.

Když je model vyřazený, už není k dispozici pro použití a odebere se z uvedených nabídek funkcí. Databricks provede následující kroky, aby zákazníky informoval o modelu, který je set pro vyřazení z provozu:

  • Na kartě modelu na stránce Obsluha pracovního prostoru Databricks se zobrazí upozornění, že model bude vyřazen z provozu.
  • V rozevírací nabídce pro vyladění základního modelu na kartě Experimenty se zobrazí zpráva s upozorněním, že je model plánovaný pro vyřazení z provozu.
  • Příslušná dokumentace obsahuje oznámení, které uvádí, že model je plánován k vyřazení z provozu, a datum, ke kterému již nebude podporován.

Jakmile budou uživatelé upozorněni na nadcházející vyřazení modelu, Databricks model vyřadí do tří měsíců. Během tohoto tříměsíčního období můžou zákazníci:

  • Zvolte migraci na koncový bod zřízené propustnosti a pokračujte v používání modelu po datu ukončení životnosti.
  • Migrujte existující pracovní postupy tak, aby používaly doporučené náhradní modely.

K datu vyřazení se model z produktu odebere a příslušná dokumentace se aktualizuje, aby doporučila použití náhradního modelu.

V tématu Vyřazené modelylist aktuálně vyřazených modelů a plánovaných dat vyřazení.

Aktualizace modelu

Databricks může dodávat přírůstkové aktualizace modelů s platbami za tokeny za účelem poskytování optimalizací. Při aktualizaci modelu zůstane adresa URL koncového bodu stejná, ale ID modelu v objektu odpovědi se změní tak, aby odráželo datum update. Pokud je například update odeslán do meta-llama/Meta-Llama-3.1-405B 3. 4. 2024, název modelu v objektu odpovědi se aktualizuje na meta-llama/Meta-Llama-3.1-405B-030424. Databricks udržuje historii verzí aktualizací, na které můžete odkazovat.

vyřazené modely

Následující části shrnují aktuální a nadcházející ukončení modelu pro rozhraní API nadace modelu s platbami za token a nabídky jemného ladění nadace modelu.

Vyřazení základního modelu

Následující table ukazuje vyřazené rodiny modelů, jejich data vyřazení a doporučené náhradní rodiny modelů, které se mají použít pro úlohy vyladění základního modelu. Databricks doporučuje migrovat aplikace tak, aby používaly náhradní modely před uvedeným datem vyřazení.

Modelová rodina Datum vyřazení Doporučená řada náhradních modelů
Meta-Llama-3 7. ledna 2025 Meta-Llama-3.1
Meta-Llama-2 7. ledna 2025 Meta-Llama-3.1
Kód Llama 7. ledna 2025 Meta-Llama-3.1

Ukončení rozhraní API základního modelu s platbami za token

Následující table ukazuje vyřazení modelů, jejich data vyřazení a doporučené náhradní modely, které se mají použít pro rozhraní API základních modelů, sloužící k úlohám účtovaným na základě platby za token. Databricks doporučuje migrovat aplikace tak, aby používaly náhradní modely před uvedeným datem vyřazení.

Důležitý

Dne 11. prosince 2024 Meta-Llama-3.3-70B-Instruct nahradil podporu Meta-Llama-3.1-70B-Instruct v koncových bodech pro Foundation Model APIs s platbou za token.

Model Datum vyřazení Doporučený náhradní model
Meta-Llama-3.1-70B-Instruct 11. prosince 2024 Meta-Llama-3.3-70B-Instruct
Meta-Llama-3-70B-Instruct 23. července 2024 Meta-Llama-3.1-70B-Instruct
Meta-Llama-2-70B-Chat 30. října 2024 Meta-Llama-3.1-70B-Instruct
MPT 7B – Instruujte 30. srpna 2024 Mixtral-8x7B
MPT 30B – pokyn 30. srpna 2024 Mixtral-8x7B

Pokud potřebujete dlouhodobou podporu pro konkrétní verzi modelu, databricks doporučuje používat rozhraní API základního modelu zřízenou propustnost pro vaše obsluhované úlohy.