Acceso a Azure OpenAI Service

Completado

El primer paso para crear una solución de IA generativa con Azure OpenAI es aprovisionar un recurso de Azure OpenAI en la suscripción de Azure. Puede empezar creando un recurso en Azure Portal o con la interfaz de la línea de comandos (CLI) de Azure.

Cree un recurso de Azure OpenAI Service en Azure Portal.

Al crear un recurso de Azure OpenAI Service, debe proporcionar un nombre de suscripción, un nombre de grupo de recursos, una región, un nombre de instancia único y seleccionar un plan de tarifa.

Captura de pantalla de la página de Azure Portal para crear un recurso de Azure OpenAI Service.

Creación de un recurso de Azure OpenAI Service en la CLI de Azure

Para crear un recurso de Azure OpenAI Service desde la CLI, consulte este ejemplo y reemplace las siguientes variables por las suyas:

  • MyOpenAIResource: reemplace por un nombre único para el recurso
  • OAIResourceGroup: reemplace por el nombre del grupo de recursos
  • eastus: reemplace por la región para implementar el recurso
  • subscriptionID: reemplace por su id. de suscripción
az cognitiveservices account create \
-n MyOpenAIResource \
-g OAIResourceGroup \
-l eastus \
--kind OpenAI \
--sku s0 \
--subscription subscriptionID

Nota

Puede encontrar las regiones disponibles para un servicio mediante el comando de la CLI az account list-locations. Para saber cómo iniciar sesión en Azure y crear un grupo de Azure a través de la CLI, puede consultar la documentación siguiente. Azure OpenAI Service proporciona acceso a varios tipos de modelos. Algunos modelos solo están disponibles en regiones específicas. Consulte la guía de disponibilidad de modelos de Azure OpenAI para consultar la disponibilidad regional. Puede crear dos recursos de Azure OpenAI por región.

Uso de Fundición de IA de Azure OpenAI

Fundición de IA de Azure proporciona acceso a los recursos de administración, implementación, experimentación, personalización y aprendizaje de modelos.

Puede acceder a Azure AI Foundry a través de Azure Portal después de crear un recurso o en https://ai.azure.com/ iniciando sesión en su cuenta de Azure. Durante el flujo de trabajo de inicio de sesión, seleccione el directorio, la suscripción de Azure y el recurso de Azure OpenAI adecuados.

Cuando abra Azure AI Foundry por primera vez, querrá ir a la página Azure OpenAI (donde solo se centra en los modelos de Azure OpenAI Service), seleccione el recurso si aún no lo ha hecho e implemente el primer modelo. Para ello, seleccione la página Implementaciones, desde donde puede implementar un modelo base y empezar a experimentar con él.

Nota:

Si no es el propietario del recurso, necesitará los siguientes controles de acceso basados en roles: 1. Usuario de OpenAI de Cognitive Services: este rol permite ver recursos y usar el área de juegos de chat. 2. Colaborador de OpenAI de Cognitive Services: este rol permite al usuario crear nuevas implementaciones.

Recorte de pantalla del menú de páginas del Portal de la Fundición de IA de Azure.

Tipos de modelos de OpenAI

Para empezar a compilar con Azure OpenAI, debe elegir un modelo base e implementarlo. Microsoft proporciona modelos base y la opción para crear modelos base personalizados. En esta unidad se tratan los modelos base disponibles actualmente.

Azure OpenAI incluye varios tipos de modelo:

  • Los modelos GPT-4 son la última generación de modelos generativos previamente entrenados (GPT) que pueden generar finalizaciones de código y lenguaje natural basadas en mensajes de lenguaje natural.
  • Los modelos GPT 3.5 pueden generar finalizaciones de código y lenguaje natural basadas en mensajes de lenguaje natural. En concreto, los modelos GPT-35-turbo están optimizados para interacciones basadas en chat y funcionan bien en la mayoría de los escenarios de IA generativos.
  • Los modelos de incrustaciones convierten texto en vectores numéricos y son útiles en escenarios de análisis de lenguaje, como comparar orígenes de texto con similitudes.
  • Los modelos DALL-E se usan para generar imágenes basándose en mensajes de lenguaje natural. Actualmente, los modelos DALL-E están en versión preliminar.
  • Los modelos de susurro se usan para convertir la voz en texto.
  • Los modelos de texto a voz se usan para convertir texto a voz.

Nota:

Los precios se determinan por tokens y por tipo de modelo. Más información sobre los precios más recientes aquí.

En el Portal de la Fundición de IA de Azure, la página Catálogo de modelos enumera los modelos base disponibles y proporciona una opción para crear modelos personalizados adicionales mediante la optimización de los modelos base. Los modelos que tienen un estado Correcto significan que se han entrenado correctamente y se pueden seleccionar para la implementación.

Observará que hay varios modelos más allá de OpenAI disponibles en el Catálogo de modelo, incluidos modelos de Microsoft, Meta, Mistral, etc. Fundición de IA de Azure le permite implementar cualquiera de estos modelos para su caso de uso. Este módulo se centrará en los modelos de Azure OpenAI.

Recorte de pantalla de los modelos de IA generativa listos para usar del Portal de la Fundición de IA de Azure.

Implementación de modelos de OpenAI

En primer lugar, debe implementar un modelo para chatear o realizar llamadas API para recibir respuestas a mensajes. Al crear una nueva implementación, debe indicar qué modelo base se va a implementar. Puede implementar cualquier número de implementaciones siempre que sus tokens por minuto (TPM) permanezcan dentro de la cuota de implementación.

Implementación mediante Fundición de IA de Azure

En la página Catálogo de modelos del Portal de la Fundición de IA de Azure, puede crear una nueva implementación seleccionando un nombre de modelo de la lista.

Implementación con la CLI de Azure

Asimismo puede implementar un modelo mediante la consola. Con este ejemplo, reemplace las siguientes variables por sus propios valores de recurso:

  • OAIResourceGroup: reemplace por el nombre del grupo de recursos
  • MyOpenAIResource: reemplácelo por el nombre del recurso.
  • MyModel: reemplácelo por un nombre único para su modelo.
  • gpt-35-turbo: reemplácelo por el modelo base que desee implementar.
az cognitiveservices account deployment create \
   -g OAIResourceGroup \
   -n MyOpenAIResource \
   --deployment-name MyModel \
   --model-name gpt-35-turbo \
   --model-version "0125"  \
   --model-format OpenAI \
   --sku-name "Standard" \
   --sku-capacity 1

Implementación mediante la API de REST

Puede implementar un modelo mediante la API REST. En el cuerpo de la solicitud, especifique el modelo base que desee implementar. Consulte un ejemplo en la documentación de Azure OpenAI.

Explorar avisos de OpenAI

Una vez implementado el modelo, puede probar cómo se finalizan los mensajes. Un mensaje es la parte de texto de una solicitud que se envía al punto de conexión de las finalizaciones del modelo implementado. Las respuestas se conocen como finalizaciones, que pueden aparecer en forma de texto, código o en otros formatos.

Tipos de avisos

Los mensajes se pueden agrupar en tipos de solicitudes según la tarea.

Tipo de tarea Ejemplo de mensaje Ejemplo de finalización
Contenido de clasificación Tweet: Disfruté del viaje.
Opinión:
Positivo
Generación de contenido nuevo Lista de formas de viajar 1. Bicicleta
2. Coche...
Conversación Asistente de IA agradable Ver ejemplos
Transformación (traducción y conversión de símbolos) Inglés: Hola
Francés:
bonjour
Resumen del contenido Se proporciona un resumen del contenido
{text}
El contenido comparte métodos de aprendizaje automático.
Continuar desde donde lo dejó Una manera de cultivar tomates es plantar semillas.
Dar respuestas con hechos ¿Cuántas lunas tiene la Tierra? Uno

Calidad de la finalización

La calidad de las finalizaciones que obtendrá de una solución de IA generativa depende de varios factores.

  • La forma en que se diseñan los mensajes. Obtenga más información sobre ingeniería rápida en la unidad Ingeniería de indicaciones, más adelante en este módulo.
  • Los parámetros del modelo (que se describen a continuación).
  • Los datos en los que se entrena el modelo, que se pueden adaptar a través de ajuste preciso del modelo con la personalización.

El entrenamiento de un modelo personalizado supone más control sobre las finalizaciones devueltas que la ingeniería de mensajería y el ajuste de los parámetros.

Realización de llamadas API

Puede empezar a realizar llamadas al modelo implementado a través de la API REST, Python o C#. Si el modelo implementado tiene una base de modelos GPT-3.5 o GPT-4, use la documentación de finalizaciones de chat, que tiene puntos de conexión y variables necesarios para estos modelos base.

Usar las áreas de juego de Azure Studio

Las áreas de juegos son interfaces útiles en Fundición de IA de Azure que puede usar para experimentar con los modelos implementados sin necesidad de desarrollar su propia aplicación cliente. El Portal de la Fundición de IA de Azure ofrece varias áreas de juegos con diferentes opciones de ajuste de parámetros.

Área de juegos de chat

El área de juegos de chat se basa en una interfaz de entrada de conversación y salida de mensaje. Puede inicializar la sesión con un mensaje del sistema para configurar el contexto de chat.

En el área de juegos de chat, puede usar ejemplos de avisos, ajustar parámetros y agregar algunos ejemplos de capturas. El término "algunos ejemplos" hace referencia a proporcionar ejemplos para ayudar al modelo a aprender lo que necesita hacer. Puede considerarse lo contrario de "sin ejemplos", que no proporciona ningún ejemplo.

Recorte de pantalla del área de juegos chat del Portal de la Fundición de IA de Azure.