Informacje o monitach o poprawę jakości ukończenia
Budowa monitów może być trudna. W praktyce monituje o skonfigurowanie wag modelu w celu ukończenia żądanego zadania, ale jest to bardziej sztuka niż nauka, często wymagając doświadczenia i intuicji, aby stworzyć udany monit.
Po wysłaniu dobrze skonstruowanych monitów do modelu model zwraca lepsze uzupełnienia.
W naszym botze rekomendacji turystycznych świetny monit system pomaga modelowi przygotować się do rekomendowania odpowiednich podwyżek. A dobry użytkownik monituje o dalsze uściślenie zaleceń zwracanych przez model.
W tej lekcji omówimy ogólne pojęcia i wzorce, których można użyć do konstruowania monitów i przyjrzenia się niektórym technikom, które mogą służyć do poprawy jakości uzupełniania.
Podstawy
Monity tekstowe to sposób interakcji użytkowników z modelami GPT. Modele języka generowania próbują utworzyć kolejną serię słów, które najprawdopodobniej będą zgodne z poprzednim tekstem. To tak, jakbyśmy mówili , co jest pierwszą rzeczą, która przychodzi do twojego umysłu, gdy mówię <monit>?
Podczas opracowywania złożonych monitów warto pamiętać o tym podstawowym zachowaniu. Niezależnie od monitu model odpowiada po prostu na to, co określa, jest najbardziej prawdopodobne, aby postępować zgodnie z monitem.
Monituj składniki
W przypadku korzystania z interfejsu API uzupełniania nie ma różnicy między różnymi częściami monitu, ale nadal warto odciąć monit w jego części składowe — ponieważ celem jest myślenie o tworzeniu monitu.
Instrukcje
Instrukcje są prawdopodobnie najczęściej używanym składnikiem monitu. Są one częścią monitu, który informuje model, co należy zrobić i może wahać się od prostych do złożonych. Na przykład Polecam wycieczki do Jesteś entuzjastą turystyki pieszej, która pomaga ludziom odkrywać zabawne wędrówki w ich okolicy. Jesteś optymistyczny i przyjazny. Przedstawiasz się, kiedy po raz pierwszy mówisz hello. Pomagając ludziom, zawsze pytasz ich, gdzie się znajdują, i intensywność turystyki pieszej, którą chcesz poinformować o rekomendacji turystycznej, którą podajesz.
Zawartość podstawowa
Zawartość podstawowa odnosi się do pewnego rodzaju tekstu przetwarzanego lub przekształcanego przez model. Jest on zwykle używany w połączeniu z instrukcjami. Na przykład po otrzymaniu tych informacji podasz trzy sugestie dotyczące pobliskich wędrówek o różnej długości.
Zawartość podstawowa może być znacznie dłuższa, na przykład prośba modelu o podsumowanie artykułu w Wikipedii.
Przykłady
Pomyślne monity często polegają na praktyce "jeden strzał" lub "kilka strzałów" uczenia. Odnosi się to do dołączenia jednego lub kilku przykładów żądanego zachowania modelu, zazwyczaj w tym par wejściowych i wyjściowych. Nie uczy się to w sensie, że model jest trwale zmieniony, ale raczej że przykłady lepiej warunkują, w jaki model odpowiada zgodnie z potrzebami tylko dla bieżącego wnioskowania.
Używanie monitów bez przykładów jest czasami określane jako nauka "zero-shot".
Hike request: I live near Seattle and would like an easy hike.
Recommendation: That's great to hear, the Seattle area has some of the best hikes in the nation! You should try Little Si, you'll love it.
Hike request: I want to go on a hike in the North Cascades that will blow my mind.
Recommendation: You won't find a bad hike in the North Cascades. However, I hear the Sahale Arm stops people in their tracks with its beauty.
Hike request: I'd like to find a strenuous hike that's just like the Enchantments, but without as many people.
Recommendation:
Kij
Wskazówki działają jako "jumpstart" dla danych wyjściowych modelu, pomagając skierować model do żądanych danych wyjściowych. Często jest to prefiks, na który może budować model. Wskazówka może kierować uzupełnianie, aby uwzględnić kluczowe elementy. Są one często używane wraz z instrukcjami.
W poniższym przykładzie przedstawiono pojedynczą wskazówkę podsumowującą wiele przeglądów szlaków.
Monit | Zakończenie |
---|---|
Przeglądy szlaku są ważnym zagadnieniem, czy turyści idą na wycieczkę, ponieważ przegląd zawiera listę bieżących warunków szlaku. [...] Podsumuj powyższy przegląd szlaków: Kluczowy odejście od przeglądów szlaku to: |
że szlak Mailbox Peak jest błotnisty w tej chwili, a komary są złe, gdy dostaniesz się nad linią drzewa. Istnieje również wiele osób na szlaku począwszy od połowy rano. |
Zawartość pomocnicza
Zawartość pomocnicza to informacje, które model może wykorzystać do wpływania na dane wyjściowe w jakiś sposób. Różni się ona od zawartości podstawowej w tym, że nie jest głównym celem ani zadaniem, ale zwykle jest używana wraz z zawartością podstawową. Typowe przykłady obejmują informacje kontekstowe, takie jak bieżąca data, nazwa użytkownika, preferencje użytkownika itd.
Najlepsze rozwiązania
- Bądź konkretny. Pozostaw jak najmniej pola do interpretacji. Ogranicz przestrzeń operacyjną.
- Bądź opisowy. Używaj analogii.
- Podwójnie w dół. Czasami może być konieczne powtórzenie polecenia dla modelu. Podaj instrukcje przed i po podstawowej zawartości, użyj instrukcji i sygnału itp.
- Kolejność ma znaczenie. Kolejność prezentowania informacji modelowi może mieć wpływ na dane wyjściowe. Niezależnie od tego, czy umieścisz instrukcje przed zawartością ("podsumuj poniższe..."), czy po ("podsumuj powyższe..."), może mieć wpływ na dane wyjściowe. Nawet kolejność kilku przykładów może mieć znaczenie. Ta technika jest określana jako stronniczość recency.
- Podstaw dane wyjściowe. Dołącz kilka słów lub fraz na końcu monitu, aby uzyskać odpowiedź modelu zgodną z żądanym formularzem.
- Nadaj modelowi wartość "out". Czasami pomocne może być podanie modelowi alternatywnej ścieżki, jeśli nie może ukończyć przydzielonego zadania. Na przykład podczas zadawania pytania dotyczącego fragmentu tekstu możesz uwzględnić coś takiego jak "odpowiedź z "nie znaleziono", jeśli odpowiedź nie jest obecna. Ta technika pomaga modelowi uniknąć generowania fałszywych odpowiedzi.
- Łańcuch myśli monitujących. Model jest poinstruowany, aby przejść krok po kroku i przedstawić wszystkie kroki. Dzięki temu można zmniejszyć prawdopodobieństwo niedokładności wyników i ułatwić ocenę odpowiedzi modelu.