Dowiedz się, kiedy dostroić model językowy

Ukończone

Zanim zaczniesz dostrajać model, musisz mieć jasne zrozumienie, czym jest dostrajanie i kiedy należy go używać.

Jeśli chcesz utworzyć aplikację czatu za pomocą usługi Azure AI Foundry, możesz użyć przepływu monitów, aby utworzyć aplikację czatu zintegrowaną z modelem językowym w celu wygenerowania odpowiedzi. Aby poprawić jakość odpowiedzi generowanych przez model, możesz wypróbować różne strategie. Najprostszą strategią jest zastosowanie inżynierii monitu. Możesz zmienić sposób formatowania pytania, ale można również zaktualizować komunikat systemowy, który jest wysyłany wraz z monitem do modelu językowego.

Monitowanie inżynieryjne to szybki i łatwy sposób ulepszania sposobu działania modelu oraz tego, co musi wiedzieć model. Jeśli chcesz jeszcze bardziej poprawić jakość modelu, istnieją dwie typowe techniki, które są używane:

  • Pobieranie rozszerzonej generacji (RAG): uziemij dane, najpierw pobierając kontekst ze źródła danych przed wygenerowaniem odpowiedzi.
  • Dostrajanie: trenowanie podstawowego modelu językowego na zestawie danych przed zintegrowaniem go w aplikacji.

Diagram przedstawiający różne strategie optymalizacji wydajności modelu.

Funkcja RAG jest najczęściej stosowana, gdy potrzebujesz odpowiedzi modelu, aby były faktyczne i zakorzenione w określonych danych. Na przykład chcesz, aby klienci zadawali pytania dotyczące hoteli oferowanych w katalogu rezerwacji podróży. Z drugiej strony, jeśli chcesz, aby model zachowywał się w określony sposób, dostrajanie może pomóc w osiągnięciu celu. Możesz również użyć kombinacji strategii optymalizacji, takich jak RAG i dostosowany model, aby ulepszyć aplikację językową.

Sposób działania modelu dotyczy głównie stylu, formatu i tonu odpowiedzi generowanych przez model. Jeśli chcesz, aby model był zgodny z określonym stylem i formatem podczas odpowiadania, możesz również poinstruować model, aby zrobił to za pomocą inżynierii monitu. Czasami jednak monity inżynieryjne mogą nie prowadzić do spójnych wyników. Nadal może się zdarzyć, że model ignoruje instrukcje i zachowuje się inaczej.

W ramach inżynierii monitów technika używana do "wymuszenia" modelu generowania danych wyjściowych w określonym formacie polega na podaniu modelu z różnymi przykładami tego, jak mogą wyglądać żądane dane wyjściowe, znane również jako jeden strzał (jeden przykład) lub kilka strzałów (kilka przykładów). Mimo to może się zdarzyć, że model nie zawsze generuje dane wyjściowe w określonym stylu i formacie.

Aby zmaksymalizować spójność zachowania modelu, możesz dostosować model podstawowy przy użyciu własnych danych treningowych.