Comprender la ingeniería de mensajería

Completado

La calidad de las indicaciones de entrada que se envían a un modelo de IA, como las disponibles en Azure OpenAI, influye directamente en la calidad de lo que obtenemos. Al construir cuidadosamente las indicaciones que se envían al modelo, este proporcionará respuestas mejores y más interesantes.

¿Qué es la ingeniería de solicitudes?

La ingeniería de indicaciones es el proceso de diseño y optimización de las indicaciones para usar mejor los modelos de IA. El diseño de mensajes eficaces es fundamental para el éxito de la ingeniería de mensajería y puede mejorar significativamente el rendimiento del modelo de inteligencia artificial en tareas específicas. Al proporcionar mensajes relevantes, específicos, inequívocos y bien estructurados, el modelo comprende mejor el contexto y genera respuestas más precisas.

Por ejemplo, si queremos que un modelo de OpenAI genere descripciones de productos, podemos proporcionarle una descripción detallada que describa las características y ventajas del producto. Al proporcionarle este contexto, el modelo genera descripciones de productos más precisas y relevantes.

La ingeniería de mensajería también puede ayudar a mitigar el sesgo y a mejorar la equidad en los modelos de inteligencia artificial. Al diseñar mensajes diversos e inclusivos, podemos asegurarnos de que el modelo no esté sesgado hacia un grupo o perspectiva concretos.

Importante

Por muy bien que diseñe un mensaje, las respuestas de los modelos de inteligencia artificial no deben darse por hechos o contemplarse como libres de sesgo. La inteligencia artificial debe usarse de forma responsable. Para más información, consulte la nota de transparencia de Microsoft sobre Azure OpenAI y los principios de la inteligencia artificial de Microsoft.

Además, la ingeniería de mensajería puede ayudarnos a comprender qué referencias usa el modelo para generar su respuesta. Los modelos de IA generativa tienen una gran cantidad de parámetros y la lógica que siguen es, en gran medida, desconocida para los usuarios, por lo que puede resultar confuso saber cómo se llega a la respuesta que proporciona. Al diseñar mensajes fáciles de entender e interpretar, podemos ayudar a los humanos a comprender mejor cómo genera el modelo sus respuestas. Esto puede ser especialmente importante en dominios como la atención sanitaria, donde es fundamental comprender cómo toma las decisiones el modelo.

Debe usar diferentes métodos al diseñar sus propios mensajes, muchos de los cuales se tratan en las próximas unidades de este módulo. Entre ellas se incluyen las instrucciones, el contenido contextual, las indicaciones o los ejemplos de pocas etapas, y el orden correcto del contenido en el mensaje. Los métodos que se tratan aquí no son todos, ya que esta área es un tema fluido con muchos detalles.

Consideraciones para los puntos de conexión de API

Los ejemplos del resto de este módulo se centrarán en ChatCompletion. Cabe destacar que ChatCompletion también se puede usar para escenarios que no son de chat, donde las instrucciones se incluyen en el mensaje del sistema y el contenido del usuario se proporciona en el mensaje de rol de usuario. La mayoría de estos ejemplos se pueden modificar para usar el punto de conexión Completion, si lo desea.

En términos de disponibilidad del modelo, el punto de conexión Completion se puede usar con gpt-3 y versiones anteriores, y ChatCompletion se puede usar con gpt-35-turbo y modelos posteriores.

Ajuste de los parámetros del modelo

Además de las técnicas descritas en este módulo, el ajuste de los parámetros del modelo puede afectar considerablemente a la respuesta. En concreto, temperature y top_p (top_probability) son los que más podrían afectar a la respuesta de un modelo, ya que ambos controlan la aleatoriedad del modelo, pero de maneras diferentes.

Los valores más altos producen respuestas más creativas y aleatorias, pero probablemente sean menos coherentes o centradas. Se espera que las respuestas sean ficticias o únicas con los valores más altos para estos parámetros, mientras que cuando se quiera contenido más coherente y concreto se deben usar valores menores.

Intente ajustar estos parámetros con el mismo mensaje para ver cómo afectan a la respuesta. Se recomienda cambiar temperature o top_p, no los dos a la vez.