Trabajar con modelos de Azure OpenAI
Azure OpenAI Service cuenta con una amplia gama de modelos con diferentes funcionalidades y puntos de precio. La disponibilidad de los modelos varía según la región.
Puede obtener una lista de los modelos que están disponibles para inferencia y optimización por el recurso Azure OpenAI mediante la API de lista de modelos.
Actualizaciones del modelo
Azure OpenAI ahora admite actualizaciones automáticas para las implementaciones de modelos seleccionados. En los modelos en los que está disponible la compatibilidad con actualizaciones automáticas, se puede ver una lista desplegable de la versión del modelo en el portal de Azure AI Foundry en Implementaciones y Editar:
Puede obtener más información sobre las versiones del modelo de Azure OpenAI y cómo funcionan en el artículo Versiones del modelo de Azure OpenAI.
Nota:
Las actualizaciones automáticas del modelo solo se admiten para los tipos de implementación estándar. Para obtener más información sobre cómo administrar las actualizaciones y migraciones de modelos en los tipos de implementación aprovisionados, consulte la sección sobre administración de modelos en los tipos de implementación aprovisionados
Actualizar automáticamente al valor predeterminado
Al establecer la implementación en Actualización automática en predeterminada, la implementación de modelo se actualiza automáticamente en un plazo de dos semanas después de un cambio en la versión predeterminada. Para una versión preliminar, se actualiza automáticamente cuando una nueva versión preliminar esté disponible a partir de dos semanas después de que se publique la nueva versión preliminar.
Si todavía está en las primeras fases de las pruebas de modelos de inferencia, se recomienda implementar los modelos con la opción Actualización automática a la versión predeterminada activada siempre que esté disponible.
Versión específica del modelo
A medida que el uso de Azure OpenAI evoluciona y empieza a compilar e integrar con aplicaciones, es posible que quiera controlar manualmente las actualizaciones del modelo. En primer lugar, puede probar y validar que el comportamiento de la aplicación es coherente para el caso de uso antes de actualizar.
Al seleccionar una versión de modelo específica para una implementación, esta versión permanecerá seleccionada hasta que elija actualizar manualmente o una vez que se alcance la fecha de retirada del modelo. Cuando se alcance la fecha de retirada, el modelo se actualizará automáticamente a la versión predeterminada en el momento de la retirada.
Visualización de fechas de retirada
Para los modelos implementados actualmente, en el portal de la Fundición de IA de Azure, seleccione Implementaciones:
Configuración de actualización de la implementación de modelos
Puede comprobar qué opciones de actualización de modelos se establecen para los modelos implementados previamente en el portal de la Fundición de IA de Azure. Seleccione Implementaciones>. En la columna Nombre de implementación, seleccione uno de los nombres de implementación resaltados en azul.
Al seleccionar un nombre de implementación, se abren las Propiedades de la implementación de modelo. Puede ver qué opciones de actualización están establecidas para la implementación en Directiva de actualización de versiones:
También se puede acceder a la propiedad correspondiente mediante REST, Azure PowerShelly la CLI de Azure.
Opción | Leído | Actualizar |
---|---|---|
REST | Sí. Si no se devuelve versionUpgradeOption , significa que es null |
Sí |
Azure PowerShell | Sí.Se puede comprobar $null en VersionUpgradeOption |
Sí |
CLI de Azure | Sí. Muestra null si versionUpgradeOption no se ha establecido. |
No. Actualmente no es posible actualizar la opción de actualización de versión. |
Hay tres opciones de actualización de implementación de modelos distintas:
Nombre | Descripción |
---|---|
OnceNewDefaultVersionAvailable |
Una vez que se ha designado una nueva versión como predeterminada, la implementación de modelo se actualiza automáticamente a la versión predeterminada en un plazo de dos semanas después de que se haya cambiado esa designación. |
OnceCurrentVersionExpired |
Cuando se alcanza la fecha de la retirada, la implementación de modelo se actualiza automáticamente a la versión predeterminada actual. |
NoAutoUpgrade |
La implementación de modelo nunca se actualizará automáticamente. Una vez alcanzada la fecha de la retirada, la implementación de modelo deja de funcionar. Deberá actualizar el código que hace referencia a esa implementación para que apunte a una implementación de modelos que no haya expirado. |
Nota:
null
equivale a OnceCurrentVersionExpired
. Si la opción Directiva de actualización de versiones no está presente en las propiedades de un modelo que admite actualizaciones, significa que el valor es actualmente null
. Una vez que modifique explícitamente este valor, la propiedad estará visible en la página de propiedades de Estudio, así como a través de la API de REST.
Ejemplos
Revise la guía de introducción de Azure PowerShell para instalar Azure PowerShell localmente, o bien puede usar Azure Cloud Shell.
En los pasos siguientes se muestra cómo comprobar la propiedad de opción VersionUpgradeOption
así como actualizarla:
// Step 1: Get Deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}
// Step 2: Show Deployment VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption
// VersionUpgradeOption can be null - one way to check is
$null -eq $deployment.Properties.VersionUpgradeOption
// Step 3: Update Deployment VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption = "NoAutoUpgrade"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku
// repeat step 1 and 2 to confirm the change.
// If not sure about deployment name, use this command to show all deployments under an account
Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName}
// To update to a new model version
// Step 1: Get Deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}
// Step 2: Show Deployment Model properties
$deployment.Properties.Model.Version
// Step 3: Update Deployed Model Version
$deployment.Properties.Model.Version = "0613"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku
// repeat step 1 and 2 to confirm the change.
Actualización e implementación de modelos mediante la API
PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments/{deploymentName}?api-version=2023-05-01
Parámetros de la ruta de acceso
Parámetro | Tipo | ¿Necesario? | Descripción |
---|---|---|---|
acountname |
string | Obligatorio | Nombre del recurso de Azure OpenAI. |
deploymentName |
string | Obligatorio | Nombre de la implementación que eligió al implementar un modelo existente o el nombre que desea que tenga una nueva implementación de modelo. |
resourceGroupName |
string | Obligatorio | Nombre del grupo de recursos asociado para esta implementación de modelo. |
subscriptionId |
string | Obligatorio | Identificador de suscripción de la suscripción asociada. |
api-version |
string | Obligatorio | Versión de API que se usará para la operación. Sigue el formato AAAA-MM-DD. |
Versiones compatibles
-
2023-05-01
Especificaciones de Swagger
Cuerpo de la solicitud
Este es solo un subconjunto de los parámetros del cuerpo de la solicitud disponibles. Para obtener la lista completa de los parámetros, puede consultar la Documentación de referencia de API de REST.
Parámetro | Tipo | Descripción |
---|---|---|
versionUpgradeOption | String | Opciones de actualización de la versión del modelo de implementación:OnceNewDefaultVersionAvailable OnceCurrentVersionExpired NoAutoUpgrade |
capacity | integer | Esto representa la cantidad de cuota que va a asignar a esta implementación. Un valor de 1 es igual a 1000 tokens por minuto (TPM) |
Solicitud de ejemplo
curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo?api-version=2023-05-01 \
-H "Content-Type: application/json" \
-H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
-d '{"sku":{"name":"Standard","capacity":120},"properties": {"model": {"format": "OpenAI","name": "gpt-35-turbo","version": "0613"},"versionUpgradeOption":"OnceCurrentVersionExpired"}}'
Nota:
Hay varias maneras de generar un token de autorización. El método más sencillo para las pruebas iniciales es iniciar Cloud Shell desde Azure Portal. A continuación, ejecute az account get-access-token
. Puede usar este token como token de autorización temporal para las pruebas de API.
Respuesta de ejemplo
{
"id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo",
"type": "Microsoft.CognitiveServices/accounts/deployments",
"name": "gpt-35-turbo",
"sku": {
"name": "Standard",
"capacity": 120
},
"properties": {
"model": {
"format": "OpenAI",
"name": "gpt-35-turbo",
"version": "0613"
},
"versionUpgradeOption": "OnceCurrentVersionExpired",
"capabilities": {
"chatCompletion": "true"
},
"provisioningState": "Succeeded",
"rateLimits": [
{
"key": "request",
"renewalPeriod": 10,
"count": 120
},
{
"key": "token",
"renewalPeriod": 60,
"count": 120000
}
]
},
"systemData": {
"createdBy": "docs@contoso.com",
"createdByType": "User",
"createdAt": "2023-02-28T02:57:15.8951706Z",
"lastModifiedBy": "docs@contoso.com",
"lastModifiedByType": "User",
"lastModifiedAt": "2023-10-31T15:35:53.082912Z"
},
"etag": "\"GUID\""
}
Administrar modelos en tipos de implementación aprovisionados
Las implementaciones aprovisionadas admiten prácticas de administración de modelos distintas. Los procedimientos de administración de modelos de implementación aprovisionados están diseñados para proporcionarle el mayor control sobre cuándo y cómo migrar entre las versiones del modelo y las familias de modelo. Actualmente, hay dos enfoques disponibles para administrar modelos en implementaciones aprovisionadas: (1) migraciones locales y (2) migraciones de implementación múltiple.
Requisitos previos
- Valide que la versión del modelo de destino o la familia de modelo sean compatibles con el tipo de implementación existente. Las migraciones solo pueden producirse entre implementaciones aprovisionadas del mismo tipo de implementación. Para obtener más información sobre los tipos de implementación, revise la documentación del tipo de implementación.
- Valide la disponibilidad de capacidad para la versión del modelo de destino o la familia de modelo antes de intentar realizar una migración. Para más información sobre cómo determinar la disponibilidad de la capacidad, revise la documentación de transparencia de capacidad.
- Para las migraciones de varias implementaciones, compruebe que tiene cuota suficiente para admitir varias implementaciones simultáneamente. Para obtener más información sobre cómo validar la cuota para cada tipo de implementación aprovisionada, revise la documentación de cuota aprovisionada.
Migraciones locales para implementaciones aprovisionadas
Las migraciones locales permiten mantener el mismo nombre y tamaño de implementación aprovisionado al cambiar la versión del modelo o la familia de modelo asignadas a esa implementación. Con las migraciones locales, Azure OpenAI Service se encarga de migrar cualquier tráfico existente entre versiones de modelo o familias de modelo a lo largo de la migración en un período de 20 a 30 minutos. A lo largo de la ventana de migración, la implementación aprovisionada mostrará un estado aprovisionado de "actualizando". Puede seguir usando la implementación aprovisionada como lo haría normalmente. Una vez completada la migración local, el estado aprovisionado se actualizará a "se ha realizado correctamente", lo que indica que todo el tráfico se ha migrado a la versión del modelo de destino o a la familia de modelo.
Migración local: actualización de la versión del modelo
Las migraciones locales destinadas a actualizar una implementación aprovisionada existente a una nueva versión del modelo dentro de la misma familia de modelo se admiten a través de Fundición de IA de Azure, la API de REST y la CLI de Azure. Para realizar una migración local destinada a una actualización de la versión del modelo en Fundición de IA de Azure, seleccione Implementaciones> en la columna Nombre de implementación y seleccione el nombre de implementación de la implementación aprovisionada que desea migrar.
Al seleccionar un nombre de implementación, se abren las Propiedades de la implementación de modelo. En esta vista, seleccione el botón Editar, que mostrará el cuadro de diálogo Actualizar implementación. Seleccione la lista desplegable de la versión del modelo para establecer una nueva versión del modelo para la implementación aprovisionada. Como se indicó, el estado de aprovisionamiento cambiará a "actualizando" durante la migración y volverá a "se ha realizado correctamente" una vez completada la migración.
Migración local: cambio de familia de modelo
La migración local que tiene como destino la actualización de una implementación aprovisionada existente a una nueva familia de modelo se admite a través de la API de REST y la CLI de Azure. Para realizar una migración local con el objetivo de cambiar de familia de modelo, use la solicitud de ejemplo siguiente como guía. En la solicitud, deberá actualizar el nombre del modelo y la versión del modelo de destino al que va a migrar.
curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment?api-version=2024-10-01 \
-H "Content-Type: application/json" \
-H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
-d '{"sku":{"name":"GlobalProvisionedManaged","capacity":100},"properties": {"model": {"format": "OpenAI","name": "gpt-4o-mini","version": "2024-07-18"}}}'
Respuesta de ejemplo
{
"id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment",
"type": "Microsoft.CognitiveServices/accounts/deployments",
"name": "gpt-4o-ptu-deployment",
"sku": {
"name": "GlobalProvisionedManaged",
"capacity": 100
},
"properties": {
"model": {
"format": "OpenAI",
"name": "gpt-4o-mini",
"version": "2024-07-18"
},
"versionUpgradeOption": "OnceCurrentVersionExpired",
"currentCapacity": 100
"capabilities": {
"area": "EUR",
"chatCompletion": "true"
"jsonObjectResponse": "true",
"maxContextToken": "128000",
"maxOutputToken": "16834",
"assistants": "true"
},
"provisioningState": "Updating",
"rateLimits": [
{
"key": "request",
"renewalPeriod": 10,
"count": 300
}
]
},
"systemData": {
"createdBy": "docs@contoso.com",
"createdByType": "User",
"createdAt": "2025-01-28T02:57:15.8951706Z",
"lastModifiedBy": "docs@contoso.com",
"lastModifiedByType": "User",
"lastModifiedAt": "2025-01-29T15:35:53.082912Z"
},
"etag": "\"GUID\""
}
Nota:
Hay varias maneras de generar un token de autorización. El método más sencillo para las pruebas iniciales es iniciar Cloud Shell desde Azure Portal. A continuación, ejecute az account get-access-token
. Puede usar este token como token de autorización temporal para las pruebas de API.
Migraciones de varias implementaciones para implementaciones aprovisionadas
Las migraciones de varias implementaciones permiten tener un mayor control sobre el proceso de migración del modelo. Con las migraciones de varias implementaciones, puede determinar la rapidez con la que desea migrar el tráfico existente a la versión del modelo de destino o a la familia de modelo en una nueva implementación aprovisionada. El proceso para migrar a una nueva versión de modelo o familia de modelo mediante el enfoque de migración de varias implementaciones es el siguiente:
- Cree una nueva implementación aprovisionada. Para esta nueva implementación, puede optar por mantener el mismo tipo de implementación aprovisionado que la implementación existente o seleccionar un nuevo tipo de implementación si lo desea.
- Cambie el tráfico de la implementación aprovisionada existente a la implementación aprovisionada recién creada con la versión del modelo de destino o la familia de modelo hasta que todo el tráfico se descargue de la implementación original.
- Una vez que el tráfico se migra a la nueva implementación, valide que no haya solicitudes de inferencia que se procesen en la implementación aprovisionada anterior asegurándose de que la métrica Solicitudes de Azure OpenAI no muestra ninguna llamada API realizada en un plazo de 5 a 10 minutos del tráfico de inferencia que se va a migrar a la nueva implementación. Para más información sobre esta métrica, consulte la documentación de Supervisión de Azure OpenAI.
- Una vez que confirme que no se han realizado llamadas de inferencia, elimine la implementación aprovisionada original.