Informatie over prompts voor het verbeteren van de voltooiingskwaliteit
Prompt constructie kan moeilijk zijn. In de praktijk handelt de prompt om de gewichten van het model te configureren om de gewenste taak te voltooien, maar het is meer van een kunst dan een wetenschap, die vaak ervaring en intuïtiefheid vereist om een succesvolle prompt te maken.
Wanneer u goed samengestelde prompts naar het model verzendt, retourneert het model betere voltooiingen.
In onze wandelaanbevelingsbot helpt een geweldige systeemprompt het model klaar te zijn om de juiste wandelingen aan te bevelen. En goede gebruikersprompts verfijnen de aanbevelingen die het model retourneert verder.
In deze les bespreken we de algemene concepten en patronen die kunnen worden gebruikt om prompts samen te stellen en enkele technieken te bekijken die kunnen worden gebruikt om de kwaliteit van de voltooiingen te verbeteren.
Basisprincipes
Tekstprompts zijn hoe gebruikers communiceren met GPT-modellen. Generatieve taalmodellen proberen de volgende reeks woorden te produceren die waarschijnlijk zullen volgen uit de vorige tekst. Het is alsof we zeggen Wat is het eerste wat in je gedachten komt als ik prompt> zeg<?
Wanneer u complexe prompts ontwikkelt, is het handig om dit fundamentele gedrag in gedachten te houden. Ongeacht de prompt reageert het model gewoon met wat het waarschijnlijk volgt na de prompt.
Promptonderdelen
Wanneer u de Voltooiings-API gebruikt, is er geen onderscheid tussen verschillende onderdelen van de prompt, maar het is nog steeds handig om de prompt in de onderdelen ervan te ontleden, omdat het doel is om na te denken over promptconstructie.
Instructies
Instructies zijn waarschijnlijk het meest gebruikte promptonderdeel. Ze maken deel uit van de prompt die aangeeft wat het model moet doen en kan variëren van eenvoudig tot complex. Raad bijvoorbeeld wandelingen aan voor u een wandelliefhebber die mensen helpt leuke wandelingen in hun omgeving te ontdekken. Je bent upbeat en vriendelijk. Je introduceert jezelf als je voor het eerst hallo zegt. Wanneer u mensen helpt, vraagt u hen altijd waar ze zich bevinden en de wandelintensiteit die u wenst te informeren over de wandelaanveling die u opgeeft.
Primaire inhoud
Primaire inhoud verwijst naar een soort tekst die wordt verwerkt of getransformeerd door het model. Deze wordt meestal gebruikt in combinatie met instructies. U geeft bijvoorbeeld drie suggesties voor wandelingen in de buurt die in lengte variëren nadat u die informatie hebt opgehaald.
Primaire inhoud kan veel langer zijn, zoals het vragen van het model om een Wikipedia-artikel samen te vatten.
Voorbeelden
Geslaagde prompts zijn vaak afhankelijk van de praktijk van 'één shot' of 'weinig-shot' leren. Dit verwijst naar het opnemen van een of meer voorbeelden van het gewenste gedrag van het model, meestal inclusief invoer- en uitvoerparen. Dit leert niet in de zin dat het model permanent wordt gewijzigd, maar dat de voorbeelden beter in staat zijn om alleen op de huidige deductie te reageren.
Het gebruik van prompts zonder voorbeelden wordt soms 'zero-shot' learning genoemd.
Hike request: I live near Seattle and would like an easy hike.
Recommendation: That's great to hear, the Seattle area has some of the best hikes in the nation! You should try Little Si, you'll love it.
Hike request: I want to go on a hike in the North Cascades that will blow my mind.
Recommendation: You won't find a bad hike in the North Cascades. However, I hear the Sahale Arm stops people in their tracks with its beauty.
Hike request: I'd like to find a strenuous hike that's just like the Enchantments, but without as many people.
Recommendation:
Keu
Aanwijzingen fungeren als de 'jumpstart' voor de uitvoer van het model en helpen het model om te leiden naar de gewenste uitvoer. Het is vaak een voorvoegsel waarop het model kan worden gebouwd. Een aanwijzing kan de voltooiing omleiden om belangrijke elementen op te nemen. Ze worden vaak samen met instructies gebruikt.
In het volgende voorbeeld ziet u een enkele aanwijzing om veel trailbeoordelingen samen te vatten.
Prompt | Voltooiing |
---|---|
Trailbeoordelingen zijn een belangrijke overweging of wandelaars op een wandeling gaan, omdat de beoordeling de huidige voorwaarden van het pad vermeldt. [...] Een overzicht van de bovenstaande paden bekijken: De belangrijkste wegname van de trailbeoordelingen zijn: |
dat het Postvak Peak-pad nu modderig is en dat de muggen slecht zijn als je boven de boomlijn komt. Er zijn ook veel mensen op het pad die halverwege de ochtend beginnen. |
Ondersteunende inhoud
Ondersteunende inhoud is informatie die het model kan gebruiken om de uitvoer op een of andere manier te beïnvloeden. Het verschilt van primaire inhoud omdat het niet het belangrijkste doel of de hoofdtaak is, maar deze wordt meestal samen met primaire inhoud gebruikt. Veelvoorkomende voorbeelden zijn contextuele informatie, zoals de huidige datum, de naam van de gebruiker, gebruikersvoorkeuren, enzovoort.
Aanbevolen procedures
- Wees specifiek. Laat zo min mogelijk over aan interpretatie. Beperk de operationele ruimte.
- Wees beschrijvend. Gebruik analogieën.
- Dubbel omlaag. Soms moet u zichzelf herhalen. Geef instructies voor en na de primaire inhoud, gebruik een instructie en een aanwijzing, enzovoort.
- Order Matters. De volgorde waarin u informatie aan het model presenteert, kan van invloed zijn op de uitvoer. Of u nu instructies plaatst voor uw inhoud ('het volgende samenvatten...') of na ('summarize the above...') kan een verschil maken in de uitvoer. Zelfs de volgorde van voorbeelden kan van belang zijn. Deze techniek wordt aangeduid als recency bias.
- De uitvoer primen. Voeg een paar woorden of woordgroepen toe aan het einde van de prompt om een modelantwoord te verkrijgen dat het gewenste formulier volgt.
- Geef het model een 'out'. Het kan soms handig zijn om het model een alternatief pad te geven als het de toegewezen taak niet kan voltooien. Als u bijvoorbeeld een vraag stelt over een stuk tekst, kunt u bijvoorbeeld 'reageren met 'niet gevonden' opnemen als het antwoord niet aanwezig is. Met deze techniek voorkomt u dat het model valse reacties genereert.
- Keten van gedachte vragen. Het model wordt geïnstrueerd om stapsgewijs door te gaan en alle betrokken stappen te presenteren. Dit vermindert de kans op onnauwkeurigheden van resultaten en maakt het beoordelen van de modelrespons eenvoudiger.