Condividi tramite


Uso dei modelli di OpenAI di Azure

Il servizio Azure OpenAI è basato su un set di modelli diversificato con funzionalità e punti di prezzo diversi. La disponibilità dei modelli varia in base all'area.

È possibile ottenere un elenco di modelli disponibili per l'inferenza e l'ottimizzazione tramite la risorsa OpenAI di Azure usando l'API Elenco modelli.

Aggiornamenti del modello

OpenAI di Azure supporta ora gli aggiornamenti automatici per le distribuzioni di modelli selezionati. Nei modelli in cui è disponibile il supporto degli aggiornamenti automatici, un elenco a discesa della versione del modello è visibile nel portale di Azure AI Foundry in Distribuzioni e modifica:

Screenshot dell'interfaccia utente del modello di distribuzione nel portale di Azure AI Foundry.

Altre informazioni sulle versioni dei modelli di OpenAI di Azure e sul relativo funzionamento sono disponibili nell'articolo Versioni dei modelli di OpenAI di Azure.

Nota

Gli aggiornamenti automatici dei modelli sono supportati solo per i tipi di distribuzione Standard. Per altre informazioni su come gestire gli aggiornamenti dei modelli e le migrazioni sui tipi di distribuzione di cui è stato effettuato il provisioning, vedere la sezione sulla gestione dei modelli sui tipi di distribuzione con provisioning

Aggiornamento automatico per impostazione predefinita

Quando si imposta la distribuzione su Aggiornamento automatico per impostazione predefinita, la distribuzione del modello viene aggiornata automaticamente entro due settimane da una modifica nella versione predefinita. Per una versione di anteprima, viene eseguito automaticamente l'aggiornamento quando una nuova versione di anteprima è disponibile a partire da due settimane dopo il rilascio della nuova versione di anteprima.

Se si sono ancora nelle fasi di test iniziali per i modelli di inferenza, è consigliabile distribuire modelli con l'opzione Aggiornamento automatico per impostazione predefinita selezionata ogni volta che è disponibile.

Versione specifica del modello

Con l'evoluzione dell'uso di OpenAI di Azure e l'inizio della creazione e dell'integrazione con applicazioni, è consigliabile controllare manualmente gli aggiornamenti dei modelli. È possibile testare e verificare innanzitutto che il comportamento dell'applicazione sia coerente per il caso d'uso prima dell'aggiornamento.

Quando si seleziona una versione specifica del modello per una distribuzione, questa versione rimane selezionata fino a quando non si sceglie di eseguire manualmente l'aggiornamento o dopo aver raggiunto la data di ritiro per il modello. Quando viene raggiunta la data di ritiro, il modello verrà aggiornato automaticamente alla versione predefinita al momento del ritiro.

Visualizzazione delle date di ritiro

Per i modelli attualmente distribuiti, nel portale di Azure AI Foundry selezionare Distribuzioni:

Screenshot dell'interfaccia utente di distribuzione del portale di Azure AI Foundry.

Configurazione dell'aggiornamento della distribuzione dei modelli

È possibile controllare le opzioni di aggiornamento del modello impostate per i modelli distribuiti in precedenza nel portale di Azure AI Foundry. Selezionare Distribuzioni> Nella colonna Nome distribuzione selezionare uno dei nomi di distribuzione evidenziati in blu.

Se si seleziona un nome di distribuzione, verranno visualizzate le Proprietà per la distribuzione del modello. È possibile visualizzare le opzioni di aggiornamento impostate per la distribuzione in Criteri di aggiornamento della versione:

Screenshot dell'interfaccia utente della proprietà delle distribuzioni dei modelli.

È anche possibile accedere alla proprietà corrispondente tramite REST, Azure PowerShelle interfaccia della riga di comando di Azure.

Opzione Lettura Aggiornamento
REST Sì. Se versionUpgradeOption non viene restituito, significa che è null
Azure PowerShell Sì.È possibile controllare VersionUpgradeOption per $null
Interfaccia della riga di comando di Azure Sì. Viene visualizzato null se versionUpgradeOption non è impostato. No. Non è attualmente possibile aggiornare l'opzione di aggiornamento della versione.

Esistono tre opzioni distinte di aggiornamento della distribuzione dei modelli:

Nome Descrizione
OnceNewDefaultVersionAvailable Quando una nuova versione viene designata come predefinita, la distribuzione dei modelli viene aggiornata automaticamente alla versione predefinita entro due settimane dalla modifica della designazione.
OnceCurrentVersionExpired Quando viene raggiunta la data di ritiro, la distribuzione dei modelli viene aggiornata automaticamente alla versione predefinita corrente.
NoAutoUpgrade La distribuzione dei modelli non viene mai aggiornata automaticamente. Quando viene raggiunta la data di ritiro, la distribuzione dei modelli smette di funzionare. È necessario aggiornare il codice che fa riferimento a tale distribuzione in modo che punti a una distribuzione dei modelli non scaduta.

Nota

null è pari a OnceCurrentVersionExpired. Se l'opzione Criteri di aggiornamento della versione non è presente nelle proprietà di un modello che supporta gli aggiornamenti dei modelli, significa che il valore è attualmente null. Dopo aver modificato in modo esplicito questo valore, la proprietà è visibile nella pagina delle proprietà di Studio e tramite l'API REST.

Esempi

Esaminare la guida introduttiva di Azure PowerShell per installare Azure PowerShell in locale oppure usare Azure Cloud Shell.

I passaggi seguenti illustrano come controllare la proprietà dell'opzione VersionUpgradeOption e aggiornarla:

// Step 1: Get Deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}
 
// Step 2: Show Deployment VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption
 
// VersionUpgradeOption can be null - one way to check is
$null -eq $deployment.Properties.VersionUpgradeOption
 
// Step 3: Update Deployment VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption = "NoAutoUpgrade"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku
 
// repeat step 1 and 2 to confirm the change.
// If not sure about deployment name, use this command to show all deployments under an account
Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName}
// To update to a new model version

// Step 1: Get Deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}

// Step 2: Show Deployment Model properties
$deployment.Properties.Model.Version

// Step 3: Update Deployed Model Version
$deployment.Properties.Model.Version = "0613"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku

// repeat step 1 and 2 to confirm the change.

Aggiornare e distribuire i modelli tramite l'API

PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments/{deploymentName}?api-version=2023-05-01

Parametri del percorso

Parametro Type Obbligatorio? Descrizione
acountname stringa Richiesto Nome della risorsa OpenAI di Azure.
deploymentName string Richiesto Nome della distribuzione scelto quando è stato distribuito un modello esistente o il nome desiderato per una nuova distribuzione del modello.
resourceGroupName string Richiesto Nome del gruppo di risorse associato per la distribuzione del modello.
subscriptionId string Richiesto ID sottoscrizione per la sottoscrizione associata.
api-version string Richiesto Versione dell'API da usare per questa operazione. Segue il formato AAAA-MM-GG.

Versioni supportate

Testo della richiesta

Si tratta solo di un subset dei parametri del corpo della richiesta disponibili. Per l'elenco completo dei parametri, è possibile fare riferimento alla documentazione di riferimento dell'API REST.

Parametro Tipo Descrizione
versionUpgradeOption String Opzioni di aggiornamento della versione del modello di distribuzione:
OnceNewDefaultVersionAvailable
OnceCurrentVersionExpired
NoAutoUpgrade
capacità integer Rappresenta la quantità di quota assegnata a questa distribuzione. Il valore 1 è uguale a 1.000 token al minuto (TPM)

Richiesta di esempi

curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo?api-version=2023-05-01 \
  -H "Content-Type: application/json" \
  -H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
  -d '{"sku":{"name":"Standard","capacity":120},"properties": {"model": {"format": "OpenAI","name": "gpt-35-turbo","version": "0613"},"versionUpgradeOption":"OnceCurrentVersionExpired"}}'

Nota

Esistono diversi modi per generare un token di autorizzazione. Il metodo più semplice per i test iniziali consiste nell'avviare Cloud Shell dal portale di Azure. Quindi eseguire az account get-access-token. È possibile usare questo token come token di autorizzazione temporaneo per il test dell'API.

Esempio di risposta

 {
  "id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo",
  "type": "Microsoft.CognitiveServices/accounts/deployments",
  "name": "gpt-35-turbo",
  "sku": {
    "name": "Standard",
    "capacity": 120
  },
  "properties": {
    "model": {
      "format": "OpenAI",
      "name": "gpt-35-turbo",
      "version": "0613"
    },
    "versionUpgradeOption": "OnceCurrentVersionExpired",
    "capabilities": {
      "chatCompletion": "true"
    },
    "provisioningState": "Succeeded",
    "rateLimits": [
      {
        "key": "request",
        "renewalPeriod": 10,
        "count": 120
      },
      {
        "key": "token",
        "renewalPeriod": 60,
        "count": 120000
      }
    ]
  },
  "systemData": {
    "createdBy": "docs@contoso.com",
    "createdByType": "User",
    "createdAt": "2023-02-28T02:57:15.8951706Z",
    "lastModifiedBy": "docs@contoso.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2023-10-31T15:35:53.082912Z"
  },
  "etag": "\"GUID\""
}

Gestione dei modelli nei tipi di distribuzione con provisioning

Le distribuzioni sottoposte a provisioning supportano procedure distinte di gestione dei modelli. Le procedure di gestione dei modelli di distribuzione con provisioning sono concepite per offrire il massimo controllo su quando e su come eseguire la migrazione tra le versioni del modello e le famiglie di modelli. Attualmente sono disponibili due approcci per gestire i modelli nelle distribuzioni con provisioning: (1) migrazioni sul posto e (2) migrazioni a più distribuzioni.

Prerequisiti

  • Verificare che la versione o la famiglia di modelli di destinazione sia supportata per il tipo di distribuzione esistente. Le migrazioni possono verificarsi solo tra distribuzioni con provisioning dello stesso tipo di distribuzione. Per altre informazioni sui tipi di distribuzione, vedere la documentazione sul tipo di distribuzione.
  • Convalidare la disponibilità della capacità per la versione o la famiglia di modelli di destinazione prima di tentare una migrazione. Per altre informazioni sulla determinazione della disponibilità della capacità, vedere la documentazione sulla trasparenza della capacità.
  • Per le migrazioni a più distribuzioni, verificare di disporre di una quota sufficiente per supportare più distribuzioni contemporaneamente. Per altre informazioni su come convalidare la quota per ogni tipo di distribuzione con provisioning, vedere la documentazione relativa alla quota con provisioning.

Migrazioni sul posto per le distribuzioni con provisioning

Le migrazioni sul posto consentono di mantenere lo stesso nome e le stesse dimensioni della distribuzione di cui è stato effettuato il provisioning modificando la versione del modello o la famiglia di modelli assegnata a tale distribuzione. Con le migrazioni sul posto, il servizio Azure OpenAI si occupa della migrazione di qualsiasi traffico esistente tra versioni del modello o famiglie di modelli durante la migrazione in un intervallo di 20-30 minuti. In tutta la finestra di migrazione, la distribuzione con provisioning visualizzerà uno stato di provisioning "aggiornamento". È possibile continuare a usare la distribuzione di cui è stato effettuato il provisioning come normalmente. Una volta completata la migrazione sul posto, lo stato di provisioning verrà aggiornato a "succeeded", a indicare che tutto il traffico è stato migrato alla versione o alla famiglia di modelli di destinazione.

Migrazione sul posto: aggiornamento della versione del modello

Le migrazioni sul posto destinate all'aggiornamento di una distribuzione con provisioning esistente a una nuova versione del modello all'interno della stessa famiglia di modelli sono supportate tramite Azure AI Foundry, l'API REST e l'interfaccia della riga di comando di Azure. Per eseguire una migrazione sul posto destinata a un aggiornamento della versione del modello in Azure AI Foundry, selezionare Distribuzioni> nella colonna nome distribuzione selezionare il nome della distribuzione con provisioning di cui si vuole eseguire la migrazione.

Se si seleziona un nome di distribuzione, verranno visualizzate le Proprietà per la distribuzione del modello. In questa visualizzazione selezionare il pulsante modifica , che mostrerà la finestra di dialogo Aggiorna distribuzione . Selezionare l'elenco a discesa versione del modello per impostare una nuova versione del modello per la distribuzione con provisioning. Come indicato, lo stato del provisioning verrà modificato in "aggiornamento" durante la migrazione e verrà ripristinato "completato" al termine della migrazione.

Screenshot della finestra di dialogo di distribuzione degli aggiornamenti con il selettore del campo della versione del modello aperto per visualizzare le opzioni della versione del modello disponibili per la selezione.

Migrazione sul posto: modifica della famiglia di modelli

La migrazione sul posto che ha come destinazione l'aggiornamento di una distribuzione con provisioning esistente in una nuova famiglia di modelli è supportata tramite l'API REST e l'interfaccia della riga di comando di Azure. Per eseguire una migrazione sul posto destinata a una modifica della famiglia di modelli, usare la richiesta di esempio seguente come guida. Nella richiesta sarà necessario aggiornare il nome del modello e la versione del modello per il modello di destinazione a cui si esegue la migrazione.

curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment?api-version=2024-10-01 \
  -H "Content-Type: application/json" \
  -H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
  -d '{"sku":{"name":"GlobalProvisionedManaged","capacity":100},"properties": {"model": {"format": "OpenAI","name": "gpt-4o-mini","version": "2024-07-18"}}}'

Esempio di risposta

 {
  "id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment",
  "type": "Microsoft.CognitiveServices/accounts/deployments",
  "name": "gpt-4o-ptu-deployment",
  "sku": {
    "name": "GlobalProvisionedManaged",
    "capacity": 100
  },
  "properties": {
    "model": {
      "format": "OpenAI",
      "name": "gpt-4o-mini",
      "version": "2024-07-18"
    },
    "versionUpgradeOption": "OnceCurrentVersionExpired",
    "currentCapacity": 100
    "capabilities": {
      "area": "EUR",
      "chatCompletion": "true"
      "jsonObjectResponse": "true",
      "maxContextToken": "128000",
      "maxOutputToken": "16834",
      "assistants": "true"
    },
    "provisioningState": "Updating",
    "rateLimits": [
      {
        "key": "request",
        "renewalPeriod": 10,
        "count": 300
      }
    ]
  },
  "systemData": {
    "createdBy": "docs@contoso.com",
    "createdByType": "User",
    "createdAt": "2025-01-28T02:57:15.8951706Z",
    "lastModifiedBy": "docs@contoso.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2025-01-29T15:35:53.082912Z"
  },
  "etag": "\"GUID\""
}

Nota

Esistono diversi modi per generare un token di autorizzazione. Il metodo più semplice per i test iniziali consiste nell'avviare Cloud Shell dal portale di Azure. Quindi eseguire az account get-access-token. È possibile usare questo token come token di autorizzazione temporaneo per il test dell'API.

Migrazioni a più distribuzioni per le distribuzioni di cui è stato effettuato il provisioning

Le migrazioni a più distribuzioni consentono di avere un maggiore controllo sul processo di migrazione del modello. Con le migrazioni a più distribuzioni, è possibile determinare la velocità con cui si vuole eseguire la migrazione del traffico esistente alla versione o alla famiglia di modelli di destinazione in una nuova distribuzione con provisioning. Il processo di migrazione a una nuova versione del modello o a una famiglia di modelli usando l'approccio di migrazione a più distribuzioni è il seguente:

  • Creare una nuova distribuzione con provisioning. Per questa nuova distribuzione, è possibile scegliere di mantenere lo stesso tipo di distribuzione con provisioning della distribuzione esistente o selezionare un nuovo tipo di distribuzione, se necessario.
  • Eseguire la transizione del traffico dalla distribuzione con provisioning esistente alla distribuzione appena creata con la versione del modello di destinazione o la famiglia di modelli fino a quando tutto il traffico non viene scaricato dalla distribuzione originale.
  • Dopo aver eseguito la migrazione del traffico alla nuova distribuzione, verificare che non siano presenti richieste di inferenza elaborate nella distribuzione con provisioning precedente assicurando che la metrica Richieste OpenAI di Azure non mostri alcuna chiamata API effettuata entro 5-10 minuti dal traffico di inferenza di cui viene eseguita la migrazione alla nuova distribuzione. Per altre informazioni su questa metrica, vedere la documentazione di Monitoraggio di Azure OpenAI.
  • Dopo aver verificato che non sono state effettuate chiamate di inferenza, eliminare la distribuzione con provisioning originale.

Passaggi successivi