Introducción
Los modelos de lenguaje crecen en popularidad a medida que crean respuestas coherentes impresionantes a las preguntas de un usuario. Especialmente cuando un usuario interactúa con un modelo de lenguaje desde el chat, proporciona una manera intuitiva de obtener la información que necesita.
Un desafío frecuente al implementar modelos de lenguaje mediante chat es la denominada base, que hace referencia a si una respuesta está anclada o conectada a la realidad o a un contexto específico. Es decir, la base hace referencia a si la respuesta de un modelo de lenguaje se basa en información fáctica.
Preguntas y respuestas sin fundamento
Cuando se usa un modelo de lenguaje para generar una respuesta a un mensaje, la única información en la que el modelo tiene que basar la respuesta procede de los datos con los que se entrenó, que a menudo suele ser solo grandes cantidades de texto no contextualizado de Internet o de algún otro origen.
Es probable que el resultado sea una respuesta gramaticalmente coherente y lógica a la pregunta, pero al no estar basada en datos factuales relevantes, carece de contexto y, de hecho, puede ser inexacta e incluir información "inventada". Por ejemplo, la pregunta "¿Qué producto debo usar para hacer X?" podría incluir detalles de un producto ficticio.
Preguntas y respuestas con fundamento
Por el contrario, puede usar un origen de datos para fundamentar la pregunta con algún contexto fáctico relevante. A continuación, la pregunta se puede enviar a un modelo de lenguaje, incluidos los datos de base, para generar una respuesta contextualizada, relevante y precisa.
El origen de datos puede ser cualquier repositorio de datos relevantes. Por ejemplo, puede usar datos de una base de datos de catálogos de productos para formular la pregunta "¿Qué producto debo usar para hacer X?" para que la respuesta incluya detalles relevantes de los productos que existen en el catálogo.
En este módulo, explorará cómo crear una aplicación propia de modelo de lenguaje basado en chat con una base, mediante la creación de un copiloto con datos propios.