Uczenie zero-shot i kilka strzałów

Artykuł
05/20/2024

W tym artykule opisano uczenie zero-shot i uczenie kilku strzałów na potrzeby inżynierii monitów na platformie .NET, w tym ich podstawowe przypadki użycia.

Wydajność modelu GPT zapewnia korzyści wynikające z inżynierii monitów, praktykę dostarczania instrukcji i przykładów modelowi w celu uściślenia danych wyjściowych. Uczenie zero-shot i uczenie kilku strzałów to techniki, których można użyć podczas udostępniania przykładów.

W przypadku uczenia zero-shot dołączasz monity, ale nie dosłowne uzupełnianie. Można uwzględnić uzupełnienia, które składają się tylko z wskazówek. Uczenie zero-shot opiera się całkowicie na istniejącej wiedzy modelu w celu generowania odpowiedzi, co zmniejsza liczbę utworzonych tokenów i może pomóc w kontrolowaniu kosztów. Jednak uczenie zero-shot nie dodaje się do wiedzy modelu.

Oto przykładowy monit zero-shot, który nakazuje modelowi ocenę danych wejściowych użytkownika w celu określenia, które z czterech możliwych intencji reprezentuje dane wejściowe, a następnie poprzeć jego odpowiedź " Intencja: ".

prompt = $"""
Instructions: What is the intent of this request?
If you don't know the intent, don't guess; instead respond with "Unknown".
Choices: SendEmail, SendMessage, CompleteTask, CreateDocument, Unknown.
User Input: {request}
Intent: 
""";

W przypadku uczenia kilku strzałów dołączono monity sparowane z dosłownymi ukończeniami. W porównaniu z uczeniem zero-shot oznacza to, że uczenie kilku strzałów generuje więcej tokenów i powoduje, że model zaktualizuje swoją wiedzę, co może sprawić, że uczenie kilku strzałów będzie bardziej intensywnie korzystające z zasobów. Jednak z tych samych powodów uczenie kilku strzałów pomaga również modelowi w generować bardziej istotne odpowiedzi.

prompt = $"""
Instructions: What is the intent of this request?
If you don't know the intent, don't guess; instead respond with "Unknown".
Choices: SendEmail, SendMessage, CompleteTask, CreateDocument, Unknown.

User Input: Can you send a very quick approval to the marketing team?
Intent: SendMessage

User Input: Can you send the full update to the marketing team?
Intent: SendEmail

User Input: {request}
Intent:
""";

Przypadki użycia uczenia zerowego

Uczenie zero-shot to praktyka przekazywania monitów, które nie są sparowane z dosłownymi ukończeniami, chociaż mogą być sparowane z sygnałem. Istnieją dwa podstawowe przypadki użycia uczenia zero-shot:

Praca z dostrojonym modułami LLMs — ponieważ opiera się ona na istniejącej wiedzy modelu, uczenie zero-shot nie jest tak intensywne, jak uczenie zastrzelone, i działa dobrze z llMs, które zostały już dostosowane do zestawów danych instrukcji. Możesz polegać wyłącznie na uczeniu zero-shot i utrzymywać koszty stosunkowo niskie.
Ustanawianie punktów odniesienia wydajności — uczenie zero-shot może pomóc w symulowaniu sposobu działania aplikacji dla rzeczywistych użytkowników. Pozwala to ocenić różne aspekty bieżącej wydajności modelu, takie jak dokładność lub precyzja. W takim przypadku zwykle używasz uczenia zero-shot, aby ustanowić punkt odniesienia wydajności, a następnie eksperymentować z uczeniem kilku strzałów, aby poprawić wydajność.

Przypadki użycia uczenia kilku strzałów

Uczenie kilku strzałów to praktyka przekazywania monitów sparowanych z uzupełnianiami dosłownymi (monitami o kilka strzałów), aby pokazać modelowi, jak reagować. W przeciwieństwie do uczenia zero-shot uczenie może dodać do wiedzy modelu. Możesz nawet użyć własnych zestawów danych, aby automatycznie wygenerować monity o kilka strzałów, wykonując generowanie rozszerzonego pobierania.

Uczenie kilku strzałów ma dwa podstawowe przypadki użycia:

Dostrajanie modułu LLM — ponieważ może ono dodać do wiedzy modelu, uczenie kilku strzałów może poprawić wydajność modelu. Powoduje to również, że model tworzy więcej tokenów niż uczenie zero-shot, co ostatecznie może stać się zbyt kosztowne, a nawet niewykonalne. Jeśli jednak twój LLM nie jest jeszcze ukarany grzywną, nie uzyskasz dobrej wydajności z monitami zero-shot, a uczenie kilku strzałów jest uzasadnione.
Rozwiązywanie problemów z wydajnością — możesz użyć uczenia kilku strzałów jako kontynuacji do uczenia zero-shot. W takim przypadku użyjesz uczenia zero-shot, aby ustanowić punkt odniesienia wydajności, a następnie eksperymentować z uczeniem kilku strzałów na podstawie użytych monitów zero-shot. Dzięki temu można dodać do wiedzy modelu po zapoznaniu się z tym, jak obecnie reaguje, dzięki czemu można iterować i poprawiać wydajność przy jednoczesnym zminimalizowaniu liczby wprowadzaniu tokenów.

Zastrzeżenia

Uczenie oparte na przykładach nie działa dobrze w przypadku złożonych zadań rozumowania. Jednak dodanie instrukcji może pomóc rozwiązać ten problem.
Uczenie kilku strzałów wymaga utworzenia długich monitów. Monity z dużą liczbą tokenów mogą zwiększyć obliczenia i opóźnienia. Zazwyczaj oznacza to zwiększenie kosztów. Istnieje również limit długości monitów.
Jeśli używasz kilku przykładów, model może nauczyć się fałszywych wzorców, takich jak "Tonacje są dwa razy bardziej pozytywne niż negatywne".

Udostępnij za pośrednictwem

Uczenie zero-shot i kilka strzałów

Przypadki użycia uczenia zerowego

Przypadki użycia uczenia kilku strzałów

Zastrzeżenia

Dodatkowe zasoby

Udostępnij za pośrednictwem

Uczenie zero-shot i kilka strzałów

Przypadki użycia uczenia zerowego

Przypadki użycia uczenia kilku strzałów

Zastrzeżenia

Powiązana zawartość

Dodatkowe zasoby