Wartungsrichtlinie für generative KI-Modelle
Dieser Artikel beschreibt die Modellwartungsrichtlinie für die Angebote für Foundation Model-APIs mit tokenbasierter Bezahlung und die Feinabstimmung von Foundation Model.
Um weiterhin die neuesten Modelle zu unterstützen, aktualisiert Databricks möglicherweise unterstützte Modelle oder stellt ältere Modelle für die Angebote für Foundation Model-APIs mit tokenbasierter Bezahlung und Foundation Model-Feinabstimmung ein.
Modellrichtlinie für den Ruhestand
Die folgende Deaktivierungsrichtlinie gilt nur für unterstützte Chat- und Vervollständigungsmodelle in den Angeboten für Foundation Model-APIs mit tokenbasierter Bezahlung und die Foundation Modell-Feinabstimmung.
Wenn ein Modell eingestellt wird, ist es nicht mehr für die Verwendung verfügbar und wird aus den angegebenen Featureangeboten entfernt. Databricks führt die folgenden Schritte aus, um Kunden über ein Modell zu informieren, das für den Ruhestand festgelegt ist:
- Eine Warnmeldung wird auf der Modellkarte von der Seite Serving Ihres Databricks-Arbeitsbereichs angezeigt, die darauf hinweist, dass das Modell außer Betrieb genommen werden soll.
- Eine Warnmeldung wird im Dropdownmenü für die Feinabstimmung des Foundation-Modells auf der Registerkarte "Experimente" angezeigt, die angibt, dass das Modell für den Ruhestand geplant ist.
- Die entsprechende Dokumentation enthält einen Hinweis, der darauf hinweist, dass das Modell auslaufen soll und ab welchem Datum es nicht mehr unterstützt wird.
Nachdem Benutzer über die bevorstehende Modellrentierung benachrichtigt wurden, wird Databricks das Modell in drei Monaten eingestellt. Während dieses dreimonatigen Zeitraums können Kunden:
- Wählen Sie die Migration zu einem bereitgestellten Durchsatzendpunkt, um das Modell über das End-of-Life-Datum hinaus weiter zu nutzen.
- Migrieren Sie vorhandene Workflows, um empfohlene Ersatzmodelle zu verwenden.
Am Einstellungsdatum wird das Modell aus dem Produkt entfernt, und die entsprechende Dokumentation wird aktualisiert, um die Verwendung eines Ersatzmodells zu empfehlen.
Eine Liste der derzeit ausgemusterten Modelle und der vorgesehenen Ausmusterungsdaten finden Sie unter Ausgemusterte Modelle.
Modellupdates
Databricks können inkrementelle Updates an Pay-per-Token-Modelle senden, um Optimierungen zu ermöglichen. Wenn ein Modell aktualisiert wird, bleibt die Endpunkt-URL gleich, aber die Modell-ID im Antwortobjekt ändert sich, um das Datum der Aktualisierung widerzuspiegeln. Wenn beispielsweise ein Update am 3.4.2024 an meta-llama/Meta-Llama-3.3-70B
ausgeliefert wird, wird der Modellname im Antwortobjekt auf meta-llama/Meta-Llama-3.3-70B-030424
aktualisiert. Databricks verwaltet einen Versionsverlauf der Updates, auf die Sie verweisen können.
Zurückgezogene Modelle
In den folgenden Abschnitten sind aktuelle und bevorstehende Modelleinstellungen für die Angebote für Foundation Model-APIs mit tokenbasierter Bezahlung und die Foundation Modell-Feinabstimmung zusammengefasst.
Einstellungen für Foundation Model-Feinabstimmung
In der folgenden Tabelle sind ausgemusterte Modellfamilien, deren Deaktivierungsdaten und empfohlene Ersatzmodellfamilien zur Verwendung bei Foundation Model Fine-Tuning-Workloads aufgeführt. Databricks empfiehlt, Ihre Anwendungen vor dem angegebenen Einstellungsdatum zu migrieren, um Ersatzmodelle zu verwenden.
Modellfamilie | Ruhestandsdatum | Empfohlene Ersatzmodellfamilie |
---|---|---|
DBRX | 30. April 2025 | Llama-3.1-70B |
Mixtral | 30. April 2025 | Llama-3.1-70B |
Mistral | 30. April 2025 | Llama-3.1-8B |
Meta-Llama-3.1-405B | 30. Januar 2025 | Llama-3.1-70B |
Meta-Llama-3 | 7. Januar 2025 | Meta-Llama-3.1 |
Meta-Llama-2 | 7. Januar 2025 | Meta-Llama-3.1 |
Code Llama | 7. Januar 2025 | Meta-Llama-3.1 |
Einstellungen für Foundation Model-APIs mit tokenbasierter Bezahlung
Die folgende Tabelle zeigt Modelleinstellungen sowie ihre Einstellungstermine und die empfohlenen Ersatzmodelle für die Verwendung mit Workloads für Foundation Model-APIs mit tokenbasierter Bezahlung. Databricks empfiehlt, Ihre Anwendungen vor dem angegebenen Einstellungsdatum zu migrieren, um Ersatzmodelle zu verwenden.
Wichtig
Am 11. Dezember 2024 ersetzte Meta-Llama-3.3-70B-Instruct die Unterstützung für Meta-Llama-3.1-70B-Instruct in den Pay-per-Token-Endpunkten der Foundation Model APIs.
Modell | Ruhestandsdatum | Empfohlenes Ersatzmodell |
---|---|---|
DBRX Instruct | 30. April 2025 | Meta-Llama-3.3-70B-Instruct |
Mixtral-8x7B Instruct | 30. April 2025 | Meta-Llama-3.3-70B-Instruct |
Meta-Llama-3.1-70B-Instruct | 11. Dezember 2024 | Meta-Llama-3.3-70B-Instruct |
Meta-Llama-3-70B-Instruct | 23. Juli 2024 | Meta-Llama-3.3-70B-Instruct |
Meta-Llama-2-70B-Chat | 30. Oktober 2024 | Meta-Llama-3.3-70B-Instruct |
MPT 7B Instruct | 30. August 2024 | Meta-Llama-3.3-70B-Instruct |
MPT 30B Instruct | 30. August 2024 | Meta-Llama-3.3-70B-Instruct |
Wenn Sie langfristige Unterstützung für eine bestimmte Modellversion benötigen, empfiehlt Databricks die Verwendung des bereitgestellten Durchsatzes von Foundation Model-APIs für Ihre Bereitstellungsworkloads.