Aspectos básicos de la generación aumentada de recuperación (RAG)
En esta sección se presentan los componentes y principios clave detrás del desarrollo de aplicaciones RAG sobre datos no estructurados.
En concreto:
- Canalización de datos: transformar documentos no estructurados, como colecciones de archivos PDF, en un formato adecuado para la recuperación mediante la canalización de datos de la aplicación RAG.
- Recuperación, aumento y generación (cadena RAG): se llama a una serie (o cadena) de pasos para:
- Comprender la pregunta del usuario.
- Recuperar los datos auxiliares.
- Llamar a un LLM para generar una respuesta basada en la pregunta del usuario y los datos auxiliares.
- Evaluación: evaluación de la aplicación RAG para determinar su calidad, costo y latencia para asegurarse de que cumple sus requisitos empresariales.
- Gobernanza y LLMOps: seguimiento y administración del ciclo de vida de cada componente, incluido el linaje de datos y la gobernanza (controles de acceso).