Udostępnij za pośrednictwem


Generowanie zasad konserwacji modeli sztucznej inteligencji

W tym artykule opisano zasady konserwacji modelu dla interfejsów API modelu foundation pay-per-token i podstawowe oferty dostrajania modelu.

Aby kontynuować obsługę najbardziej najnowocześniejszych modeli, usługa Databricks może aktualizować obsługiwane modele lub wycofać starsze modele dla interfejsów API modelu Foundation— płatność za token i oferty dostrajania modelu foundation.

Zasady wycofywania modelu

Poniższe zasady wycofywania dotyczą tylko obsługiwanych modeli czatów i uzupełniania w interfejsach API modelu foundation pay-per-token i foundation Model Fine-tuning oferty.

Po wycofaniu modelu nie jest już dostępny do użycia i jest usuwany ze wskazanych ofert funkcji. Usługa Databricks wykonuje następujące kroki, aby powiadomić klientów o modelu ustawionym na emeryturę:

  • Na karcie modelu zostanie wyświetlony komunikat ostrzegawczy ze strony Obsługa obszaru roboczego usługi Databricks, który wskazuje, że model jest planowany na wycofanie.
  • Komunikat ostrzegawczy jest wyświetlany w menu rozwijanym dostrajania modelu podstawowego na karcie Eksperymenty, który wskazuje, że model jest planowany na wycofanie.
  • Odpowiednia dokumentacja zawiera powiadomienie wskazujące, że model jest planowany na wycofanie i data rozpoczęcia, która nie będzie już obsługiwana.

Po powiadomieniu użytkowników o nadchodzącym wycofaniu modelu usługa Databricks wycofa model w ciągu trzech miesięcy. W tym okresie trzech miesięcy klienci mogą:

  • Wybierz migrację do punktu końcowego aprowizowanej przepływności, aby kontynuować korzystanie z modelu po dacie zakończenia okresu istnienia
  • Migrowanie istniejących przepływów pracy w celu używania zalecanych modeli zastępczych.

W dniu wycofania model zostanie usunięty z produktu, a odpowiednia dokumentacja zostanie zaktualizowana, aby zalecić użycie modelu zastępczego.

Zobacz Wycofane modele , aby zapoznać się z listą aktualnie wycofanych modeli i zaplanowanych dat wycofania.

Aktualizacje modelu

Usługa Databricks może dostarczać przyrostowe aktualizacje modeli płatności za token w celu dostarczania optymalizacji. Po zaktualizowaniu modelu adres URL punktu końcowego pozostaje taki sam, ale identyfikator modelu w obiekcie odpowiedzi zmieni się, aby odzwierciedlić datę aktualizacji. Jeśli na przykład aktualizacja jest dostarczana do meta-llama/Meta-Llama-3.1-405B dnia 3.4.2024 r., nazwa modelu w obiekcie odpowiedzi zostanie zaktualizowana do meta-llama/Meta-Llama-3.1-405B-030424. Usługa Databricks przechowuje historię wersji aktualizacji, do których można się odwoływać.

Wycofane modele

W poniższych sekcjach przedstawiono bieżące i nadchodzące wycofywanie modeli dla interfejsów API modelu foundation pay-per-token i oferty dostrajania modelu foundation.

Dostrajanie modelu fundacji — wycofywanie

W poniższej tabeli przedstawiono wycofane rodziny modeli, ich daty wycofania i zalecane rodziny modeli zastępczych do użycia dla obciążeń dostrajania modelu foundation. Usługa Databricks zaleca migrowanie aplikacji do używania modeli zastępczych przed wskazaną datą wycofania.

Rodzina modeli Data wycofania Zalecana rodzina modeli zastępczych
Meta-Llama-3 7 stycznia 2025 r. Meta-Llama-3.1
Meta-Llama-2 7 stycznia 2025 r. Meta-Llama-3.1
Llama kodu 7 stycznia 2025 r. Meta-Llama-3.1

Interfejsy API modelu foundation — wycofywanie płatności za token

W poniższej tabeli przedstawiono wycofywanie modeli, ich daty wycofania i zalecane modele zastępcze do użycia w przypadku obciążeń obsługujących tokeny dla interfejsów API modelu foundation. Usługa Databricks zaleca migrowanie aplikacji do używania modeli zastępczych przed wskazaną datą wycofania.

Ważne

11 grudnia 2024 r. Meta-Llama-3.3-70B-Instruct zastąpiło wsparcie dla Meta-Llama-3.1-70B-Instruct w punktach końcowych API modelu bazowego płatności za-token.

Model Data wycofania Zalecany model zastępczy
Meta-Llama-3.1-70B-Poinstruowanie 11 grudnia 2024 r. Meta-Llama-3.3-70B-Instruct
Meta-Llama-3-70B-Poinstruowanie 23 lipca 2024 r. Meta-Llama-3.1-70B-Poinstruowanie
Meta-Llama-2-70B-Chat 30 października 2024 r. Meta-Llama-3.1-70B-Poinstruowanie
Poinstruowanie MPT 7B 30 sierpnia 2024 r. Mixtral-8x7B
MpT 30B Poinstruowanie 30 sierpnia 2024 r. Mixtral-8x7B

Jeśli wymagana jest długoterminowa obsługa określonej wersji modelu, usługa Databricks zaleca używanie interfejsów API modelu foundation dla aprowizowanej przepływności dla obciążeń obsługujących.