Wartungsrichtlinie für generative KI-Modelle

Artikel
02/11/2025

Dieser Artikel beschreibt die Modellwartungsrichtlinie für die Angebote für Foundation Model-APIs mit tokenbasierter Bezahlung und die Feinabstimmung von Foundation Model.

Um weiterhin die neuesten Modelle zu unterstützen, aktualisiert Databricks möglicherweise unterstützte Modelle oder stellt ältere Modelle für die Angebote für Foundation Model-APIs mit tokenbasierter Bezahlung und Foundation Model-Feinabstimmung ein.

Modellrichtlinie für den Ruhestand

Die folgende Deaktivierungsrichtlinie gilt nur für unterstützte Chat- und Vervollständigungsmodelle in den Angeboten für Foundation Model-APIs mit tokenbasierter Bezahlung und die Foundation Modell-Feinabstimmung.

Wenn ein Modell eingestellt wird, ist es nicht mehr für die Verwendung verfügbar und wird aus den angegebenen Featureangeboten entfernt. Databricks führt die folgenden Schritte aus, um Kunden über ein Modell zu informieren, das für den Ruhestand festgelegt ist:

Eine Warnmeldung wird auf der Modellkarte von der Seite Serving Ihres Databricks-Arbeitsbereichs angezeigt, die darauf hinweist, dass das Modell außer Betrieb genommen werden soll.
Eine Warnmeldung wird im Dropdownmenü für die Feinabstimmung des Foundation-Modells auf der Registerkarte "Experimente" angezeigt, die angibt, dass das Modell für den Ruhestand geplant ist.
Die entsprechende Dokumentation enthält einen Hinweis, der darauf hinweist, dass das Modell auslaufen soll und ab welchem Datum es nicht mehr unterstützt wird.

Nachdem Benutzer über die bevorstehende Modellrentierung benachrichtigt wurden, wird Databricks das Modell in drei Monaten eingestellt. Während dieses dreimonatigen Zeitraums können Kunden:

Wählen Sie die Migration zu einem bereitgestellten Durchsatzendpunkt, um das Modell über das End-of-Life-Datum hinaus weiter zu nutzen.
Migrieren Sie vorhandene Workflows, um empfohlene Ersatzmodelle zu verwenden.

Am Einstellungsdatum wird das Modell aus dem Produkt entfernt, und die entsprechende Dokumentation wird aktualisiert, um die Verwendung eines Ersatzmodells zu empfehlen.

Eine Liste der derzeit ausgemusterten Modelle und der vorgesehenen Ausmusterungsdaten finden Sie unter Ausgemusterte Modelle.

Modellupdates

Databricks können inkrementelle Updates an Pay-per-Token-Modelle senden, um Optimierungen zu ermöglichen. Wenn ein Modell aktualisiert wird, bleibt die Endpunkt-URL gleich, aber die Modell-ID im Antwortobjekt ändert sich, um das Datum der Aktualisierung widerzuspiegeln. Wenn beispielsweise ein Update am 3.4.2024 an meta-llama/Meta-Llama-3.3-70B ausgeliefert wird, wird der Modellname im Antwortobjekt auf meta-llama/Meta-Llama-3.3-70B-030424aktualisiert. Databricks verwaltet einen Versionsverlauf der Updates, auf die Sie verweisen können.

Zurückgezogene Modelle

In den folgenden Abschnitten sind aktuelle und bevorstehende Modelleinstellungen für die Angebote für Foundation Model-APIs mit tokenbasierter Bezahlung und die Foundation Modell-Feinabstimmung zusammengefasst.

Einstellungen für Foundation Model-Feinabstimmung

In der folgenden Tabelle sind ausgemusterte Modellfamilien, deren Deaktivierungsdaten und empfohlene Ersatzmodellfamilien zur Verwendung bei Foundation Model Fine-Tuning-Workloads aufgeführt. Databricks empfiehlt, Ihre Anwendungen vor dem angegebenen Einstellungsdatum zu migrieren, um Ersatzmodelle zu verwenden.

Modellfamilie	Ruhestandsdatum	Empfohlene Ersatzmodellfamilie
DBRX	30. April 2025	Llama-3.1-70B
Mixtral	30. April 2025	Llama-3.1-70B
Mistral	30. April 2025	Llama-3.1-8B
Meta-Llama-3.1-405B	30. Januar 2025	Llama-3.1-70B
Meta-Llama-3	7. Januar 2025	Meta-Llama-3.1
Meta-Llama-2	7. Januar 2025	Meta-Llama-3.1
Code Llama	7. Januar 2025	Meta-Llama-3.1

Einstellungen für Foundation Model-APIs mit tokenbasierter Bezahlung

Die folgende Tabelle zeigt Modelleinstellungen sowie ihre Einstellungstermine und die empfohlenen Ersatzmodelle für die Verwendung mit Workloads für Foundation Model-APIs mit tokenbasierter Bezahlung. Databricks empfiehlt, Ihre Anwendungen vor dem angegebenen Einstellungsdatum zu migrieren, um Ersatzmodelle zu verwenden.

Wichtig

Am 11. Dezember 2024 ersetzte Meta-Llama-3.3-70B-Instruct die Unterstützung für Meta-Llama-3.1-70B-Instruct in den Pay-per-Token-Endpunkten der Foundation Model APIs.

Modell	Ruhestandsdatum	Empfohlenes Ersatzmodell
DBRX Instruct	30. April 2025	Meta-Llama-3.3-70B-Instruct
Mixtral-8x7B Instruct	30. April 2025	Meta-Llama-3.3-70B-Instruct
Meta-Llama-3.1-70B-Instruct	11. Dezember 2024	Meta-Llama-3.3-70B-Instruct
Meta-Llama-3-70B-Instruct	23. Juli 2024	Meta-Llama-3.3-70B-Instruct
Meta-Llama-2-70B-Chat	30. Oktober 2024	Meta-Llama-3.3-70B-Instruct
MPT 7B Instruct	30. August 2024	Meta-Llama-3.3-70B-Instruct
MPT 30B Instruct	30. August 2024	Meta-Llama-3.3-70B-Instruct

Wenn Sie langfristige Unterstützung für eine bestimmte Modellversion benötigen, empfiehlt Databricks die Verwendung des bereitgestellten Durchsatzes von Foundation Model-APIs für Ihre Bereitstellungsworkloads.

Freigeben über