Información general: Implementación de modelos de IA en el portal de Azure AI Foundry
El catálogo de modelos de Azure AI Foundry es el centro para detectar y usar una amplia gama de modelos para crear aplicaciones de IA generativa. Los modelos deben implementarse para que estén disponibles para recibir solicitudes de inferencia. El proceso de interacción con un modelo implementado se denomina inferencia. Azure AI Foundry ofrece un conjunto completo de opciones de implementación para esos modelos en función de sus necesidades y requisitos de modelo.
Implementar modelos
Las opciones de implementación varían en función del tipo de modelo:
- Modelos de Azure OpenAI: Los modelos OpenAI más recientes que tienen características empresariales de Azure.
- Modelos como modelos de servicio: Estos modelos no requieren cuota de proceso de la suscripción. Esta opción le permite implementar el modelo como servicio (MaaS). Se usa una implementación de API sin servidor y se factura por token de forma de pago por uso.
- Modelos abiertos y personalizados: El catálogo de modelos ofrece acceso a una gran variedad de modelos entre modalidades de acceso abierto. Puede hospedar modelos abiertos en su propia suscripción con infraestructura administrada, máquinas virtuales y número de instancias para la administración de capacidad. Hay una amplia gama de modelos de Azure OpenAI, Hugging Face y NVIDIA.
Azure AI Foundry ofrece cuatro opciones de implementación diferentes:
Nombre | Servicio Azure OpenAI | Servicio de inferencia de modelos de Azure AI | API sin servidor | Proceso administrado |
---|---|---|---|---|
¿Qué modelos se pueden implementar? | Modelos de Azure OpenAI | Modelos y modelos de Azure OpenAI como servicio | Modelos como servicio | Modelos abiertos y personalizados |
Recurso de implementación | Recurso de Azure OpenAI | Recurso Servicios de Azure AI | Proyecto de IA (recurso) | Proyecto de IA (recurso) |
Más adecuado cuando | Planee usar solo modelos de OpenAI. | Planee aprovechar las ventajas de los modelos insignia en el catálogo de Azure AI, incluido OpenAI. | Planee usar un único modelo de un proveedor específico (excepto OpenAI). | Si tiene previsto usar modelos abiertos y tiene suficiente cuota de proceso disponible en la suscripción. |
Bases de facturación | Uso de tokens y PTU | Uso de tokens | Uso de tokens1 | Horas de núcleo de proceso2 |
Instrucciones de implementación | Implementación en Azure OpenAI Service | Implementación en la inferencia de modelos de Azure AI | Implementación en la API sin servidor | Implementación en proceso administrado |
1 Se factura por minuto una infraestructura de punto de conexión mínima. En el pago por uso, no se le factura por la infraestructura que hospeda el propio modelo. Después de eliminar el punto de conexión, no se acumulan cargos adicionales.
2 La facturación se realiza por minuto, en función del nivel de producto y del número de instancias usadas en la implementación desde el momento de la creación. Después de eliminar el punto de conexión, no se acumulan cargos adicionales.
Sugerencia
Consulte supervisar los costos de los modelos ofrecidos en Azure Marketplace para obtener más información sobre cómo realizar un seguimiento de los costos.
¿Cómo debo pensar en las opciones de implementación?
Azure AI Foundry anima a los clientes a explorar las opciones de implementación y elegir la que mejor se adapte a sus necesidades empresariales y técnicas. En general, puede usar el siguiente proceso de pensamiento:
Comience con las opciones de implementación que tienen los ámbitos más grandes. Esto le permite iterar y crear prototipos más rápido en la aplicación sin tener que volver a generar la arquitectura cada vez que decida cambiar algo. Servicio de inferencia de modelos de Azure AI es un destino de implementación que admite todos los modelos insignia del catálogo de Azure AI, incluida la innovación más reciente de Azure OpenAI.
Cuando quiera usar un modelo específico:
Cuando esté interesado en los modelos de Azure OpenAI, use Azure OpenAI Service, que ofrece una amplia gama de funcionalidades para ellos y está diseñado para ellos.
Si está interesado en un modelo determinado de Modelos como servicio y no espera usar ningún otro tipo de modelo, use Puntos de conexión de API sin servidor. Permiten la implementación de un único modelo en un conjunto único de claves y direcciones URL del punto de conexión.
Cuando el modelo no esté disponible en Modelos como servicio y tenga cuota de proceso disponible en su suscripción, use Managed Compute que admiten la implementación de modelos abiertos y personalizados. También permite un alto nivel de personalización del servidor de inferencia de implementación, protocolos y configuración detallada.
Sugerencia
Cada opción de implementación puede ofrecer diferentes funcionalidades en términos de redes, seguridad y características adicionales, como la seguridad del contenido. Revise la documentación de cada uno de ellos para comprender sus limitaciones.