Samouczek: tworzenie i wdrażanie przebiegu dostrajania modelu podstawowego
Ważne
Ta funkcja jest dostępna w publicznej wersji zapoznawczej w następujących regionach: centralus
, , eastus
eastus2
, northcentralus
i westus
.
W tym artykule opisano sposób tworzenia i konfigurowania przebiegu przy użyciu dostrajania modelu podstawowego (obecnie część interfejsu API trenowania modelu mozaiki sztucznej inteligencji), a następnie przejrzeć wyniki i wdrożyć model przy użyciu interfejsu użytkownika usługi Databricks i interfejsu użytkownika mozaiki usługi AI Model Serving.
Wymagania
- Obszar roboczy w jednym z następujących regionów platformy Azure:
centralus
, ,eastus
eastus2
,northcentralus
westcentralus
, ,westus
, .westus3
- Databricks Runtime 12.2 LTS ML lub nowszy.
- Ten samouczek musi zostać uruchomiony w notesie usługi Databricks.
- Dane szkoleniowe w akceptowanym formacie. Zobacz Przygotowywanie danych do dostrajania modelu podstawowego.
Krok 1. Przygotowanie danych do szkolenia
Zobacz Przygotowywanie danych do dostrajania modelu podstawowego.
Krok 2. Instalowanie zestawu databricks_genai
SDK
Użyj poniższej instrukcji, aby zainstalować zestaw databricks_genai
SDK.
%pip install databricks_genai
Następnie zaimportuj bibliotekę foundation_model
:
dbutils.library.restartPython()
from databricks.model_training import foundation_model as fm
Krok 3. Tworzenie przebiegu trenowania
Utwórz przebieg trenowania przy użyciu funkcji dostrajania create()
modelu podstawowego. Wymagane są następujące parametry:
model
: model, który chcesz wytrenować.train_data_path
: lokalizacja zestawu danych trenowania.register_to
: wykaz wykazu aparatu Unity i schemat, w którym mają być zapisane punkty kontrolne.
Na przykład:
run = fm.create(model='meta-llama/Meta-Llama-3.1-8B-Instruct',
train_data_path='dbfs:/Volumes/main/my-directory/ift/train.jsonl', # UC Volume with JSONL formatted data
register_to='main.my-directory',
training_duration='1ep')
run
Krok 4. Wyświetlanie stanu przebiegu
Czas potrzebny na ukończenie przebiegu trenowania zależy od liczby tokenów, modelu i dostępności procesora GPU. W celu szybszego trenowania usługa Databricks zaleca korzystanie z zarezerwowanych zasobów obliczeniowych. Skontaktuj się ze swoim zespołem kont usługi Databricks, aby uzyskać szczegółowe informacje.
Po uruchomieniu przebiegu możesz monitorować jego stan przy użyciu polecenia get_events()
.
run.get_events()
Krok 5. Wyświetlanie metryk i danych wyjściowych
Wykonaj następujące kroki, aby wyświetlić wyniki w interfejsie użytkownika usługi Databricks:
- W obszarze roboczym usługi Databricks kliknij pozycję Eksperymenty na lewym pasku nawigacyjnym.
- Wybierz eksperyment z listy.
- Przejrzyj wykresy metryk na karcie Wykresy . Metryki trenowania są generowane dla każdego przebiegu trenowania, a metryki oceny są generowane tylko w przypadku podania ścieżki danych oceny.
- Podstawowa metryka trenowania przedstawiająca postęp jest stratą. Utrata oceny może służyć do sprawdzenia, czy model jest nadmiernie dopasowany do danych treningowych. Nie należy jednak polegać na całkowitej utracie, ponieważ w nadzorowanych zadaniach szkoleniowych utrata oceny może wydawać się nadmierna, podczas gdy model nadal się poprawia.
- Im większa dokładność, tym lepiej model, ale należy pamiętać, że dokładność zbliżona do 100% może wykazać nadmierne dopasowanie.
- Po uruchomieniu w narzędziu MLflow są wyświetlane następujące metryki:
LanguageCrossEntropy
oblicza krzyżową entropię w danych wyjściowych modelowania języka. Niższy wynik jest lepszy.LanguagePerplexity
mierzy, jak dobrze model językowy przewiduje następny wyraz lub znak w bloku tekstu na podstawie poprzednich słów lub znaków. Niższy wynik jest lepszy.TokenAccuracy
oblicza dokładność na poziomie tokenu na potrzeby modelowania języka. Wyższy wynik jest lepszy.
- Na tej karcie można również wyświetlić dane wyjściowe monitów oceny, jeśli zostały określone.
Krok 6. Ocena wielu dostosowanych modeli za pomocą oceny agenta mozaiki AI przed wdrożeniem
Zobacz Co to jest ocena agenta mozaiki sztucznej inteligencji?.
Krok 7. Wdrażanie modelu
Przebieg trenowania automatycznie rejestruje model w wykazie aparatu Unity po zakończeniu. Model jest rejestrowany na podstawie tego, co zostało określone w register_to
polu w metodzie run create()
.
Aby wdrożyć model do obsługi, wykonaj następujące kroki:
- Przejdź do modelu w katalogu aparatu Unity.
- Kliknij pozycję Obsłuż ten model.
- Kliknij pozycję Utwórz obsługujący punkt końcowy.
- W polu Nazwa podaj nazwę punktu końcowego.
- Kliknij pozycję Utwórz.
Dodatkowe zasoby
- Tworzenie przebiegu trenowania przy użyciu interfejsu API dostosowywania modelu podstawowego
- Dostrajanie modelu podstawowego
- Udostępnianie modeli za pomocą usługi Azure Databricks
- Zobacz szczegółowe dostrajanie instrukcji: nazwany notes demonstracyjny rozpoznawania jednostek, aby zapoznać się z przykładem dostrajania instrukcji, który przeprowadzi cię przez proces przygotowywania danych, dostrajania przebiegu trenowania i wdrażania.