Generowanie zasad konserwacji modeli sztucznej inteligencji
W tym artykule opisano zasady konserwacji modelu dla interfejsów API modelu foundation pay-per-token i podstawowe oferty dostrajania modelu.
Aby kontynuować obsługę najbardziej najnowocześniejszych modeli, usługa Databricks może aktualizować obsługiwane modele lub wycofać starsze modele dla interfejsów API modelu Foundation— płatność za token i oferty dostrajania modelu foundation.
Zasady wycofywania modelu
Poniższe zasady wycofywania dotyczą tylko obsługiwanych modeli czatów i uzupełniania w interfejsach API modelu foundation pay-per-token i foundation Model Fine-tuning oferty.
Po wycofaniu modelu nie jest już dostępny do użycia i jest usuwany ze wskazanych ofert funkcji. Usługa Databricks wykonuje następujące kroki, aby powiadomić klientów o modelu ustawionym na emeryturę:
- Na karcie modelu zostanie wyświetlony komunikat ostrzegawczy ze strony Obsługa obszaru roboczego usługi Databricks, który wskazuje, że model jest planowany na wycofanie.
- Komunikat ostrzegawczy jest wyświetlany w menu rozwijanym dostrajania modelu podstawowego na karcie Eksperymenty, który wskazuje, że model jest planowany na wycofanie.
- Odpowiednia dokumentacja zawiera powiadomienie wskazujące, że model jest planowany na wycofanie i data rozpoczęcia, która nie będzie już obsługiwana.
Po powiadomieniu użytkowników o nadchodzącym wycofaniu modelu usługa Databricks wycofa model w ciągu trzech miesięcy. W tym okresie trzech miesięcy klienci mogą:
- Wybierz migrację do punktu końcowego aprowizowanej przepływności, aby kontynuować korzystanie z modelu po dacie zakończenia okresu istnienia
- Migrowanie istniejących przepływów pracy w celu używania zalecanych modeli zastępczych.
W dniu wycofania model zostanie usunięty z produktu, a odpowiednia dokumentacja zostanie zaktualizowana, aby zalecić użycie modelu zastępczego.
Zobacz Wycofane modele , aby zapoznać się z listą aktualnie wycofanych modeli i zaplanowanych dat wycofania.
Aktualizacje modelu
Usługa Databricks może dostarczać przyrostowe aktualizacje modeli płatności za token w celu dostarczania optymalizacji. Po zaktualizowaniu modelu adres URL punktu końcowego pozostaje taki sam, ale identyfikator modelu w obiekcie odpowiedzi zmieni się, aby odzwierciedlić datę aktualizacji. Jeśli na przykład aktualizacja jest dostarczana do meta-llama/Meta-Llama-3.1-405B
dnia 3.4.2024 r., nazwa modelu w obiekcie odpowiedzi zostanie zaktualizowana do meta-llama/Meta-Llama-3.1-405B-030424
. Usługa Databricks przechowuje historię wersji aktualizacji, do których można się odwoływać.
Wycofane modele
W poniższych sekcjach przedstawiono bieżące i nadchodzące wycofywanie modeli dla interfejsów API modelu foundation pay-per-token i oferty dostrajania modelu foundation.
Dostrajanie modelu fundacji — wycofywanie
W poniższej tabeli przedstawiono wycofane rodziny modeli, ich daty wycofania i zalecane rodziny modeli zastępczych do użycia dla obciążeń dostrajania modelu foundation. Usługa Databricks zaleca migrowanie aplikacji do używania modeli zastępczych przed wskazaną datą wycofania.
Rodzina modeli | Data wycofania | Zalecana rodzina modeli zastępczych |
---|---|---|
Meta-Llama-3 | 7 stycznia 2025 r. | Meta-Llama-3.1 |
Meta-Llama-2 | 7 stycznia 2025 r. | Meta-Llama-3.1 |
Llama kodu | 7 stycznia 2025 r. | Meta-Llama-3.1 |
Interfejsy API modelu foundation — wycofywanie płatności za token
W poniższej tabeli przedstawiono wycofywanie modeli, ich daty wycofania i zalecane modele zastępcze do użycia w przypadku obciążeń obsługujących tokeny dla interfejsów API modelu foundation. Usługa Databricks zaleca migrowanie aplikacji do używania modeli zastępczych przed wskazaną datą wycofania.
Ważne
11 grudnia 2024 r. Meta-Llama-3.3-70B-Instruct zastąpiło wsparcie dla Meta-Llama-3.1-70B-Instruct w punktach końcowych API modelu bazowego płatności za-token.
Model | Data wycofania | Zalecany model zastępczy |
---|---|---|
Meta-Llama-3.1-70B-Poinstruowanie | 11 grudnia 2024 r. | Meta-Llama-3.3-70B-Instruct |
Meta-Llama-3-70B-Poinstruowanie | 23 lipca 2024 r. | Meta-Llama-3.1-70B-Poinstruowanie |
Meta-Llama-2-70B-Chat | 30 października 2024 r. | Meta-Llama-3.1-70B-Poinstruowanie |
Poinstruowanie MPT 7B | 30 sierpnia 2024 r. | Mixtral-8x7B |
MpT 30B Poinstruowanie | 30 sierpnia 2024 r. | Mixtral-8x7B |
Jeśli wymagana jest długoterminowa obsługa określonej wersji modelu, usługa Databricks zaleca używanie interfejsów API modelu foundation dla aprowizowanej przepływności dla obciążeń obsługujących.