Prueba de modelos en el área de juegos de Inteligencia artificial de Azure Studio

Completado

Las áreas de juegos son interfaces útiles de Inteligencia artificial de Azure Studio que puede usar para experimentar con los modelos implementados sin necesidad de desarrollar una aplicación cliente propia. Inteligencia artificial de Azure Studio ofrece varias áreas de juegos con diferentes opciones de ajuste de parámetros.

Área de juegos de finalizaciones

Esta área de juegos permite realizar llamadas a los modelos implementados mediante una interfaz de entrada y salida de texto y ajustar los parámetros. Debe seleccionar el nombre de implementación del modelo en "Implementaciones". Opcionalmente, puede usar los ejemplos proporcionados para empezar y, luego, puede escribir sus propios mensajes.

Parámetros del área de juegos de finalizaciones

Hay muchos parámetros que puede ajustar para cambiar el rendimiento del modelo:

  • Temperatura: controla la aleatoriedad. Reducir la temperatura significa que el modelo genera respuestas más repetitivas y deterministas. Aumentar la temperatura da como resultado respuestas más inesperadas o creativas. Intente ajustar la temperatura o el Top P pero no ambos.
  • Longitud máxima (tokens): establezca un límite en el número de tokens por respuesta del modelo. La API admite hasta 4000 tokens compartidos entre la solicitud (incluidos el mensaje del sistema, los ejemplos, el historial de mensajes y la consulta del usuario) y la respuesta del modelo. Un token equivale aproximadamente a cuatro caracteres de un texto típico en inglés.
  • Secuencias de detención: haga que las respuestas se detengan en un punto deseado, como al final de una oración o una lista. Especifique hasta cuatro secuencias en las que el modelo dejará de generar más tokens en una respuesta. El texto devuelto no contendrá la secuencia de detención.
  • Probabilidades principales: de forma similar a la temperatura, este parámetro controla la aleatoriedad, pero usa un método diferente. Al reducir Top P, la selección de tokens del modelo se reduce a los más probables. Aumentar Top P permite al modelo elegir entre tokens con alta y baja probabilidad. Intente ajustar la temperatura o el Top P pero no ambos.
  • Penalización de frecuencia: reduzca la posibilidad de repetir un token proporcionalmente en función de la frecuencia con la que ha aparecido en el texto hasta ahora. Así se reduce la probabilidad de repetir exactamente el mismo texto en una respuesta.
  • Penalización de presencia: reduzca la posibilidad de repetir cualquier token que haya aparecido en el texto hasta ahora. Así aumenta la probabilidad de introducir nuevos temas en una respuesta.
  • Texto anterior a la respuesta: inserte texto después de la entrada del usuario y antes de la respuesta del modelo. Esto puede ayudar a preparar el modelo para una respuesta.
  • Texto posterior a la respuesta: inserte texto después de la respuesta generada por el modelo para animar al usuario a realizar más aportaciones, como cuando se modela una conversación.

Área de juegos de chat

El área de juegos de chat se basa en una interfaz de entrada de conversación y salida de mensaje. Puede inicializar la sesión con un mensaje del sistema para configurar el contexto de chat.

En el área de juegos de chat, puede agregar algunos ejemplos. El término "algunos ejemplos" hace referencia a proporcionar ejemplos para ayudar al modelo a aprender lo que necesita hacer. Puede considerarse lo contrario de "sin ejemplos", que no proporciona ningún ejemplo.

En la configuración del Asistente, puede proporcionar algunos ejemplos de lo que puede ser la entrada de usuario y cuál debe ser la respuesta del asistente. El asistente intenta imitar las respuestas que se incluyen aquí en cuanto al tono, las reglas y el formato que ha definido en el mensaje del sistema.

Recorte de pantalla del área de juegos de chat del portal de Inteligencia artificial de Azure Studio.

Parámetros del área de juegos de chat

El área de juegos Chat, como el área de juegos Finalizaciones, también incluye parámetros para personalizar el comportamiento del modelo. El área de juegos Chat también admite otros parámetros que no están disponibles en el área de juegos Finalizaciones. Entre ellas se incluyen las siguientes:

  • Respuesta máxima: establezca un límite en el número de tokens por respuesta del modelo. La API admite hasta 4000 tokens compartidos entre la solicitud (incluidos el mensaje del sistema, los ejemplos, el historial de mensajes y la consulta del usuario) y la respuesta del modelo. Un token equivale aproximadamente a cuatro caracteres de un texto típico en inglés.
  • Mensajes anteriores incluidos: seleccione el número de mensajes anteriores que se incluirán en cada nueva solicitud de API. Incluir mensajes anteriores ayuda a proporcionar contexto al modelo para las nuevas consultas de los usuarios. Establecer este número en 10 da como resultado cinco consultas del usuario y cinco respuestas del sistema.

El recuento de tokens actual se puede ver en el área de juegos de chat. Dado que las llamadas API tienen un precio por token y es posible establecer un límite máximo de tokens de respuesta, querrá vigilar el recuento de tokens actual para asegurarse de que la conversación no supere el número máximo.