Introdução
Os modelos linguísticos estão a crescer em popularidade à medida que criam respostas coerentes impressionantes às perguntas de um utilizador. Especialmente quando um usuário interage com um modelo de linguagem através do chat, ele fornece uma maneira intuitiva de obter as informações de que precisa.
Um desafio predominante na implementação de modelos de linguagem por meio do chat é a chamada fundamentação, que se refere a saber se uma resposta está enraizada, conectada ou ancorada na realidade ou em um contexto específico. Em outras palavras, fundamentação refere-se a se a resposta de um modelo de linguagem é baseada em informações factuais.
Prompts e respostas infundados
Quando você usa um modelo de linguagem para gerar uma resposta a um prompt, a única informação em que o modelo tem que basear a resposta vem dos dados nos quais ele foi treinado - que muitas vezes são apenas grandes quantidades de texto não contextualizado da Internet ou de alguma outra fonte.
O resultado provavelmente será uma resposta gramaticalmente coerente e lógica ao prompt, mas como não está fundamentado em dados relevantes e factuais, não é contextualizado; e pode, de facto, ser imprecisa e incluir informação "inventada". Por exemplo, a pergunta "Qual produto devo usar para fazer X?" pode incluir detalhes de um produto fictício.
Prompts e respostas fundamentados
Por outro lado, você pode usar uma fonte de dados para fundamentar o prompt com algum contexto factual relevante. O prompt pode então ser enviado a um modelo de linguagem, incluindo os dados de fundamentação, para gerar uma resposta contextualizada, relevante e precisa.
A fonte de dados pode ser qualquer repositório de dados relevantes. Por exemplo, você pode usar dados de um banco de dados de catálogo de produtos para aterrar o prompt "Qual produto devo usar para fazer X?" para que a resposta inclua detalhes relevantes dos produtos existentes no catálogo.
Neste módulo, você explora como criar seu próprio aplicativo de modelo de linguagem baseado em bate-papo que é fundamentado, construindo um copiloto com seus próprios dados.