Delen via


Werken met Azure OpenAI-modellen

Azure OpenAI Service wordt mogelijk gemaakt door een diverse set modellen met verschillende mogelijkheden en prijspunten. De beschikbaarheid van modellen verschilt per regio.

U kunt een lijst met modellen ophalen die beschikbaar zijn voor zowel deductie als het verfijnen van uw Azure OpenAI-resource met behulp van de Api voor modellenlijst.

Modelupdates

Azure OpenAI ondersteunt nu automatische updates voor geselecteerde modelimplementaties. Op modellen waar ondersteuning voor automatische updates beschikbaar is, is een vervolgkeuzelijst met modelversies zichtbaar in de Azure AI Foundry-portal onder Implementaties en Bewerken:

Schermopname van de gebruikersinterface van het implementatiemodel in de Azure AI Foundry-portal.

Meer informatie over Azure OpenAI-modelversies en hoe ze werken in het artikel over Azure OpenAI-modelversies .

Automatisch bijwerken naar standaardwaarde

Wanneer u uw implementatie instelt op automatisch bijwerken op standaard, wordt uw modelimplementatie automatisch bijgewerkt binnen twee weken na een wijziging in de standaardversie. Voor een preview-versie wordt deze automatisch bijgewerkt wanneer een nieuwe preview-versie beschikbaar is vanaf twee weken nadat de nieuwe preview-versie is uitgebracht.

Als u zich nog in de vroege testfasen voor deductiemodellen bevindt, raden we u aan modellen met automatisch bijwerken te implementeren op standaardinstelling wanneer deze beschikbaar is.

Specifieke modelversie

Naarmate uw gebruik van Azure OpenAI zich ontwikkelt en u begint met het bouwen en integreren met toepassingen, wilt u mogelijk handmatig modelupdates beheren. U kunt eerst testen en valideren dat uw toepassingsgedrag consistent is voor uw use-case voordat u een upgrade uitvoert.

Wanneer u een specifieke modelversie voor een implementatie selecteert, blijft deze versie geselecteerd totdat u ervoor kiest om uzelf handmatig bij te werken of wanneer u de buitengebruikstellingsdatum voor het model hebt bereikt. Wanneer de buitengebruikstellingsdatum is bereikt, wordt het model automatisch bijgewerkt naar de standaardversie op het moment van buitengebruikstelling.

Buitengebruikstellingsdatums weergeven

Selecteer Implementaties in de Azure AI Foundry-portal voor momenteel geïmplementeerde modellen:

Schermopname van de implementatiegebruikersinterface van de Azure AI Foundry-portal.

Upgradeconfiguratie voor modelimplementatie

U kunt controleren welke upgradeopties voor modellen zijn ingesteld voor eerder geïmplementeerde modellen in de Azure AI Foundry-portal. Selecteer Implementaties> onder de kolom Implementatienaam een van de implementatienamen die blauw zijn gemarkeerd.

Als u een implementatienaam selecteert, worden de eigenschappen voor de modelimplementatie geopend. U kunt bekijken welke upgradeopties zijn ingesteld voor uw implementatie onder Versie-updatebeleid:

Schermopname van de gebruikersinterface van de eigenschap modelimplementaties.

De bijbehorende eigenschap kan ook worden geopend via REST, Azure PowerShell en Azure CLI.

Optie Lezen Bijwerken
REST Ja. Als versionUpgradeOption het niet wordt geretourneerd, betekent dit dat het is null Ja
Azure PowerShell Ja. VersionUpgradeOption kan worden gecontroleerd op $null Ja
Azure-CLI Ja. Deze wordt weergegeven null als versionUpgradeOption deze niet is ingesteld. Nee Het is momenteel niet mogelijk om de versie-upgradeoptie bij te werken.

Er zijn drie verschillende upgradeopties voor modelimplementatie:

Name Beschrijving
OnceNewDefaultVersionAvailable Zodra een nieuwe versie is aangewezen als de standaardversie, wordt de modelimplementatie automatisch bijgewerkt naar de standaardversie binnen twee weken nadat die aanduiding is gewijzigd.
OnceCurrentVersionExpired Zodra de buitengebruikstellingsdatum is bereikt, wordt de modelimplementatie automatisch bijgewerkt naar de huidige standaardversie.
NoAutoUpgrade De modelimplementatie wordt nooit automatisch bijgewerkt. Zodra de buitengebruikstellingsdatum is bereikt, werkt de modelimplementatie niet meer. U moet uw code bijwerken die naar die implementatie verwijst om te verwijzen naar een niet-verlopen modelimplementatie.

Notitie

null is equivalent aan OnceCurrentVersionExpired. Als de optie Versie-updatebeleid niet aanwezig is in de eigenschappen voor een model dat modelupgrades ondersteunt, geeft dit aan dat de waarde momenteel nullis. Zodra u deze waarde expliciet hebt gewijzigd, is de eigenschap zichtbaar op de pagina met studio-eigenschappen en via de REST API.

Voorbeelden

Raadpleeg de aan de slag-handleiding voor Azure PowerShell om Azure PowerShell lokaal te installeren of u kunt De Azure Cloud Shell gebruiken.

In de onderstaande stappen ziet u hoe u de VersionUpgradeOption optieeigenschap controleert en deze bijwerkt:

// Step 1: Get Deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}
 
// Step 2: Show Deployment VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption
 
// VersionUpgradeOption can be null - one way to check is
$null -eq $deployment.Properties.VersionUpgradeOption
 
// Step 3: Update Deployment VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption = "NoAutoUpgrade"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku
 
// repeat step 1 and 2 to confirm the change.
// If not sure about deployment name, use this command to show all deployments under an account
Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName}
// To update to a new model version

// Step 1: Get Deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}

// Step 2: Show Deployment Model properties
$deployment.Properties.Model.Version

// Step 3: Update Deployed Model Version
$deployment.Properties.Model.Version = "0613"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku

// repeat step 1 and 2 to confirm the change.

Modellen bijwerken en implementeren via de API

PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments/{deploymentName}?api-version=2023-05-01

Padparameters

Parameter Type Vereist? Beschrijving
acountname tekenreeks Vereist De naam van uw Azure OpenAI-resource.
deploymentName tekenreeks Vereist De implementatienaam die u hebt gekozen bij het implementeren van een bestaand model of de naam die u wilt gebruiken voor een nieuwe modelimplementatie.
resourceGroupName tekenreeks Vereist De naam van de gekoppelde resourcegroep voor deze modelimplementatie.
subscriptionId tekenreeks Vereist Abonnements-id voor het bijbehorende abonnement.
api-version tekenreeks Vereist De API-versie die voor deze bewerking moet worden gebruikt. Dit volgt de indeling JJJJ-MM-DD.

Ondersteunde versies

Aanvraagbody

Dit is slechts een subset van de beschikbare parameters voor de aanvraagbody. Raadpleeg de REST API-referentiedocumentatie voor de volledige lijst met parameters.

Parameter Type Description
versionUpgradeOption String Upgradeopties voor implementatiemodelversie:
OnceNewDefaultVersionAvailable
OnceCurrentVersionExpired
NoAutoUpgrade
capacity geheel getal Dit vertegenwoordigt de hoeveelheid quotum die u aan deze implementatie toewijst. Een waarde van 1 is gelijk aan 1000 tokens per minuut (TPM)

Voorbeeld van aanvraag

curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo?api-version=2023-05-01 \
  -H "Content-Type: application/json" \
  -H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
  -d '{"sku":{"name":"Standard","capacity":120},"properties": {"model": {"format": "OpenAI","name": "gpt-35-turbo","version": "0613"},"versionUpgradeOption":"OnceCurrentVersionExpired"}}'

Notitie

Er zijn meerdere manieren om een autorisatietoken te genereren. De eenvoudigste methode voor eerste tests is het starten van Cloud Shell vanuit Azure Portal. Voer vervolgens az account get-access-token uit. U kunt dit token gebruiken als uw tijdelijke autorisatietoken voor API-tests.

Voorbeeld van een antwoord

 {
  "id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo",
  "type": "Microsoft.CognitiveServices/accounts/deployments",
  "name": "gpt-35-turbo",
  "sku": {
    "name": "Standard",
    "capacity": 120
  },
  "properties": {
    "model": {
      "format": "OpenAI",
      "name": "gpt-35-turbo",
      "version": "0613"
    },
    "versionUpgradeOption": "OnceCurrentVersionExpired",
    "capabilities": {
      "chatCompletion": "true"
    },
    "provisioningState": "Succeeded",
    "rateLimits": [
      {
        "key": "request",
        "renewalPeriod": 10,
        "count": 120
      },
      {
        "key": "token",
        "renewalPeriod": 60,
        "count": 120000
      }
    ]
  },
  "systemData": {
    "createdBy": "docs@contoso.com",
    "createdByType": "User",
    "createdAt": "2023-02-28T02:57:15.8951706Z",
    "lastModifiedBy": "docs@contoso.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2023-10-31T15:35:53.082912Z"
  },
  "etag": "\"GUID\""
}

Modellen beheren voor ingerichte implementatietypen

Ingerichte implementaties ondersteunen afzonderlijke procedures voor modelbeheer. Ingerichte beheerprocedures voor implementatiemodellen zijn bedoeld om u de grootste controle te geven over wanneer en hoe u migreert tussen modelversies en modelfamilies. Er zijn momenteel twee methoden beschikbaar voor het beheren van modellen voor ingerichte implementaties: (1) in-place migraties en (2) migraties met meerdere implementaties.

Vereisten

  • Controleer of de versie of modelfamilie van het doelmodel wordt ondersteund voor uw bestaande implementatietype. Migraties kunnen alleen plaatsvinden tussen ingerichte implementaties van hetzelfde implementatietype. Raadpleeg de documentatie van het implementatietype voor meer informatie over implementatietypen.
  • Valideer de beschikbaarheid van capaciteit voor uw doelmodelversie of modelfamilie voordat u een migratie uitvoert. Raadpleeg de documentatie over capaciteitstransparantie voor meer informatie over het bepalen van de beschikbaarheid van capaciteit.
  • Voor migraties met meerdere implementaties controleert u of u voldoende quotum hebt om meerdere implementaties tegelijkertijd te ondersteunen. Raadpleeg de ingerichte quotadocumentatie voor meer informatie over het valideren van quota voor elk ingericht implementatietype.

In-place migraties voor ingerichte implementaties

Met in-place migraties kunt u dezelfde ingerichte implementatienaam en -grootte behouden terwijl u de modelversie of modelfamilie wijzigt die aan die implementatie is toegewezen. Met in-place migraties zorgt Azure OpenAI Service ervoor dat al het verkeer tussen modelversies of modelfamilies gedurende de migratie gedurende een periode van 20-30 minuten wordt gemigreerd. Tijdens het migratievenster wordt in uw ingerichte implementatie de ingerichte status 'bijgewerkt' weergegeven. U kunt uw ingerichte implementatie blijven gebruiken zoals u dat normaal zou doen. Zodra de in-place migratie is voltooid, wordt de ingerichte status bijgewerkt naar Geslaagd, waarmee wordt aangegeven dat al het verkeer is gemigreerd naar de doelmodelversie of modelfamilie.

In-place migratie: modelversie-update

In-place migraties die gericht zijn op het bijwerken van een bestaande ingerichte implementatie naar een nieuwe modelversie binnen dezelfde modelfamilie, worden ondersteund via Azure AI Foundry, REST API en Azure CLI. Als u een in-place migratie wilt uitvoeren die is gericht op een modelversie-update in Azure AI Foundry, selecteert u Implementaties> onder de kolom implementatienaam de implementatienaam van de ingerichte implementatie die u wilt migreren.

Als u een implementatienaam selecteert, worden de eigenschappen voor de modelimplementatie geopend. Selecteer in deze weergave de knop Bewerken , waarin het dialoogvenster Implementatie bijwerken wordt weergegeven. Selecteer de vervolgkeuzelijst voor de modelversie om een nieuwe modelversie in te stellen voor de ingerichte implementatie. Zoals vermeld, wordt de inrichtingsstatus gewijzigd in 'bijwerken' tijdens de migratie en wordt deze teruggezet naar 'geslaagd' zodra de migratie is voltooid.

Schermopname van het dialoogvenster Update-implementatie met de veldkiezer voor modelversie geopend om opties voor modelversie weer te geven die beschikbaar zijn voor selectie.

In-place migratie: modelfamiliewijziging

In-place migratie die is gericht op het bijwerken van een bestaande ingerichte implementatie naar een nieuwe modelfamilie, worden ondersteund via REST API en Azure CLI. Als u een in-place migratie wilt uitvoeren die is gericht op een modelfamiliewijziging, gebruikt u de onderstaande voorbeeldaanvraag als richtlijn. In de aanvraag moet u de modelnaam en modelversie bijwerken voor het doelmodel waarnaar u migreert.

curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment?api-version=2024-10-01 \
  -H "Content-Type: application/json" \
  -H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
  -d '{"sku":{"name":"GlobalProvisionedManaged","capacity":100},"properties": {"model": {"format": "OpenAI","name": "gpt-4o-mini","version": "2024-07-18"}}}'

Voorbeeld van een antwoord

 {
  "id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment",
  "type": "Microsoft.CognitiveServices/accounts/deployments",
  "name": "gpt-4o-ptu-deployment",
  "sku": {
    "name": "GlobalProvisionedManaged",
    "capacity": 100
  },
  "properties": {
    "model": {
      "format": "OpenAI",
      "name": "gpt-4o-mini",
      "version": "2024-07-18"
    },
    "versionUpgradeOption": "OnceCurrentVersionExpired",
    "currentCapacity": 100
    "capabilities": {
      "area": "EUR",
      "chatCompletion": "true"
      "jsonObjectResponse": "true",
      "maxContextToken": "128000",
      "maxOutputToken": "16834",
      "assistants": "true"
    },
    "provisioningState": "Updating",
    "rateLimits": [
      {
        "key": "request",
        "renewalPeriod": 10,
        "count": 300
      }
    ]
  },
  "systemData": {
    "createdBy": "docs@contoso.com",
    "createdByType": "User",
    "createdAt": "2025-01-28T02:57:15.8951706Z",
    "lastModifiedBy": "docs@contoso.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2025-01-29T15:35:53.082912Z"
  },
  "etag": "\"GUID\""
}

Notitie

Er zijn meerdere manieren om een autorisatietoken te genereren. De eenvoudigste methode voor eerste tests is het starten van Cloud Shell vanuit Azure Portal. Voer vervolgens az account get-access-token uit. U kunt dit token gebruiken als uw tijdelijke autorisatietoken voor API-tests.

Migraties met meerdere implementaties voor ingerichte implementaties

Met migraties met meerdere implementaties hebt u meer controle over het modelmigratieproces. Met migraties met meerdere implementaties kunt u dicteren hoe snel u uw bestaande verkeer wilt migreren naar de doelmodelversie of modelfamilie op een nieuwe ingerichte implementatie. Het proces voor migratie naar een nieuwe modelversie of modelfamilie met behulp van de migratiebenadering voor meerdere implementaties is als volgt:

  • Maak een nieuwe ingerichte implementatie. Voor deze nieuwe implementatie kunt u ervoor kiezen om hetzelfde ingerichte implementatietype te behouden als uw bestaande implementatie of om desgewenst een nieuw implementatietype te selecteren.
  • Overgang van verkeer van de bestaande ingerichte implementatie naar de zojuist gemaakte ingerichte implementatie met uw doelmodelversie of modelfamilie totdat al het verkeer wordt offload van de oorspronkelijke implementatie.
  • Zodra verkeer naar de nieuwe implementatie is gemigreerd, controleert u of er geen deductieaanvragen worden verwerkt in de vorige ingerichte implementatie door ervoor te zorgen dat de metrische gegevens voor Azure OpenAI-aanvragen geen API-aanroepen tonen die binnen 5-10 minuten na het deductieverkeer worden gemigreerd naar de nieuwe implementatie. Zie de Documentatie over Azure OpenAI bewaken voor meer informatie over deze metrische gegevens.
  • Nadat u hebt bevestigd dat er geen deductieoproepen zijn gedaan, verwijdert u de oorspronkelijke ingerichte implementatie.

Volgende stappen