Introduktion
Språkmodeller växer i popularitet eftersom de skapar imponerande sammanhängande svar på en användares frågor. Särskilt när en användare interagerar med en språkmodell via chatt är det ett intuitivt sätt att få den information de behöver.
En vanlig utmaning när du implementerar språkmodeller via chatt är den så kallade grundlösheten, som refererar till om ett svar är rotat, anslutet eller förankrat i verkligheten eller en specifik kontext. Med andra ord hänvisar grunderna till huruvida svaret från en språkmodell baseras på faktisk information.
Ogrundade frågor och svar
När du använder en språkmodell för att generera ett svar på en fråga, kommer den enda information som modellen har att basera svaret på från de data som den har tränats på , vilket ofta bara är stora mängder icke-text från Internet eller någon annan källa.
Resultatet kommer sannolikt att vara ett grammatiskt sammanhängande och logiskt svar på uppmaningen, men eftersom det inte är grundat i relevanta faktadata är det intetextualiserat. och kan i själva verket vara felaktiga och innehålla "uppfunnen" information. Frågan "Vilken produkt ska jag använda för att göra X?" kan till exempel innehålla information om en fiktiv produkt.
Jordade uppmaningar och svar
Däremot kan du använda en datakälla för att jorda prompten med en relevant, faktisk kontext. Uppmaningen kan sedan skickas till en språkmodell, inklusive grunddata, för att generera ett kontextualiserat, relevant och korrekt svar.
Datakällan kan vara valfri lagringsplats för relevanta data. Du kan till exempel använda data från en produktkatalogdatabas för att ange "Vilken produkt ska jag använda för att göra X?" så att svaret innehåller relevant information om produkter som finns i katalogen.
I den här modulen utforskar du hur du skapar ett eget chattbaserat språkmodellprogram som baseras genom att skapa en andrepilot med dina egna data.