Werken met Azure OpenAI-modellen
Azure OpenAI Service wordt mogelijk gemaakt door een diverse set modellen met verschillende mogelijkheden en prijspunten. De beschikbaarheid van modellen verschilt per regio.
U kunt een lijst met modellen ophalen die beschikbaar zijn voor zowel deductie als het verfijnen van uw Azure OpenAI-resource met behulp van de Api voor modellenlijst.
Modelupdates
Azure OpenAI ondersteunt nu automatische updates voor geselecteerde modelimplementaties. Op modellen waar ondersteuning voor automatische updates beschikbaar is, is een vervolgkeuzelijst met modelversies zichtbaar in de Azure AI Foundry-portal onder Implementaties en Bewerken:
Meer informatie over Azure OpenAI-modelversies en hoe ze werken in het artikel over Azure OpenAI-modelversies .
Notitie
Automatische modelupdates worden alleen ondersteund voor standaardimplementatietypen. Raadpleeg de sectie over het beheren van modellen voor ingerichte implementatietypen voor het beheren van modellen over ingerichte implementatietypen voor meer informatie over het beheren van modelupdates en migraties
Automatisch bijwerken naar standaardwaarde
Wanneer u uw implementatie instelt op automatisch bijwerken op standaard, wordt uw modelimplementatie automatisch bijgewerkt binnen twee weken na een wijziging in de standaardversie. Voor een preview-versie wordt deze automatisch bijgewerkt wanneer een nieuwe preview-versie beschikbaar is vanaf twee weken nadat de nieuwe preview-versie is uitgebracht.
Als u zich nog in de vroege testfasen voor deductiemodellen bevindt, raden we u aan modellen met automatisch bijwerken te implementeren op standaardinstelling wanneer deze beschikbaar is.
Specifieke modelversie
Naarmate uw gebruik van Azure OpenAI zich ontwikkelt en u begint met het bouwen en integreren met toepassingen, wilt u mogelijk handmatig modelupdates beheren. U kunt eerst testen en valideren dat uw toepassingsgedrag consistent is voor uw use-case voordat u een upgrade uitvoert.
Wanneer u een specifieke modelversie voor een implementatie selecteert, blijft deze versie geselecteerd totdat u ervoor kiest om uzelf handmatig bij te werken of wanneer u de buitengebruikstellingsdatum voor het model hebt bereikt. Wanneer de buitengebruikstellingsdatum is bereikt, wordt het model automatisch bijgewerkt naar de standaardversie op het moment van buitengebruikstelling.
Buitengebruikstellingsdatums weergeven
Selecteer Implementaties in de Azure AI Foundry-portal voor momenteel geïmplementeerde modellen:
Upgradeconfiguratie voor modelimplementatie
U kunt controleren welke upgradeopties voor modellen zijn ingesteld voor eerder geïmplementeerde modellen in de Azure AI Foundry-portal. Selecteer Implementaties> onder de kolom Implementatienaam een van de implementatienamen die blauw zijn gemarkeerd.
Als u een implementatienaam selecteert, worden de eigenschappen voor de modelimplementatie geopend. U kunt bekijken welke upgradeopties zijn ingesteld voor uw implementatie onder Versie-updatebeleid:
De bijbehorende eigenschap kan ook worden geopend via REST, Azure PowerShell en Azure CLI.
Optie | Lezen | Bijwerken |
---|---|---|
REST | Ja. Als versionUpgradeOption het niet wordt geretourneerd, betekent dit dat het is null |
Ja |
Azure PowerShell | Ja.
VersionUpgradeOption kan worden gecontroleerd op $null |
Ja |
Azure-CLI | Ja. Deze wordt weergegeven null als versionUpgradeOption deze niet is ingesteld. |
Nee Het is momenteel niet mogelijk om de versie-upgradeoptie bij te werken. |
Er zijn drie verschillende upgradeopties voor modelimplementatie:
Name | Beschrijving |
---|---|
OnceNewDefaultVersionAvailable |
Zodra een nieuwe versie is aangewezen als de standaardversie, wordt de modelimplementatie automatisch bijgewerkt naar de standaardversie binnen twee weken nadat die aanduiding is gewijzigd. |
OnceCurrentVersionExpired |
Zodra de buitengebruikstellingsdatum is bereikt, wordt de modelimplementatie automatisch bijgewerkt naar de huidige standaardversie. |
NoAutoUpgrade |
De modelimplementatie wordt nooit automatisch bijgewerkt. Zodra de buitengebruikstellingsdatum is bereikt, werkt de modelimplementatie niet meer. U moet uw code bijwerken die naar die implementatie verwijst om te verwijzen naar een niet-verlopen modelimplementatie. |
Notitie
null
is equivalent aan OnceCurrentVersionExpired
. Als de optie Versie-updatebeleid niet aanwezig is in de eigenschappen voor een model dat modelupgrades ondersteunt, geeft dit aan dat de waarde momenteel null
is. Zodra u deze waarde expliciet hebt gewijzigd, is de eigenschap zichtbaar op de pagina met studio-eigenschappen en via de REST API.
Voorbeelden
Raadpleeg de aan de slag-handleiding voor Azure PowerShell om Azure PowerShell lokaal te installeren of u kunt De Azure Cloud Shell gebruiken.
In de onderstaande stappen ziet u hoe u de VersionUpgradeOption
optieeigenschap controleert en deze bijwerkt:
// Step 1: Get Deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}
// Step 2: Show Deployment VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption
// VersionUpgradeOption can be null - one way to check is
$null -eq $deployment.Properties.VersionUpgradeOption
// Step 3: Update Deployment VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption = "NoAutoUpgrade"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku
// repeat step 1 and 2 to confirm the change.
// If not sure about deployment name, use this command to show all deployments under an account
Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName}
// To update to a new model version
// Step 1: Get Deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}
// Step 2: Show Deployment Model properties
$deployment.Properties.Model.Version
// Step 3: Update Deployed Model Version
$deployment.Properties.Model.Version = "0613"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku
// repeat step 1 and 2 to confirm the change.
Modellen bijwerken en implementeren via de API
PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments/{deploymentName}?api-version=2023-05-01
Padparameters
Parameter | Type | Vereist? | Beschrijving |
---|---|---|---|
acountname |
tekenreeks | Vereist | De naam van uw Azure OpenAI-resource. |
deploymentName |
tekenreeks | Vereist | De implementatienaam die u hebt gekozen bij het implementeren van een bestaand model of de naam die u wilt gebruiken voor een nieuwe modelimplementatie. |
resourceGroupName |
tekenreeks | Vereist | De naam van de gekoppelde resourcegroep voor deze modelimplementatie. |
subscriptionId |
tekenreeks | Vereist | Abonnements-id voor het bijbehorende abonnement. |
api-version |
tekenreeks | Vereist | De API-versie die voor deze bewerking moet worden gebruikt. Dit volgt de indeling JJJJ-MM-DD. |
Ondersteunde versies
-
2023-05-01
Swagger-specificatie
Aanvraagbody
Dit is slechts een subset van de beschikbare parameters voor de aanvraagbody. Raadpleeg de REST API-referentiedocumentatie voor de volledige lijst met parameters.
Parameter | Type | Description |
---|---|---|
versionUpgradeOption | String | Upgradeopties voor implementatiemodelversie:OnceNewDefaultVersionAvailable OnceCurrentVersionExpired NoAutoUpgrade |
capacity | geheel getal | Dit vertegenwoordigt de hoeveelheid quotum die u aan deze implementatie toewijst. Een waarde van 1 is gelijk aan 1000 tokens per minuut (TPM) |
Voorbeeld van aanvraag
curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo?api-version=2023-05-01 \
-H "Content-Type: application/json" \
-H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
-d '{"sku":{"name":"Standard","capacity":120},"properties": {"model": {"format": "OpenAI","name": "gpt-35-turbo","version": "0613"},"versionUpgradeOption":"OnceCurrentVersionExpired"}}'
Notitie
Er zijn meerdere manieren om een autorisatietoken te genereren. De eenvoudigste methode voor eerste tests is het starten van Cloud Shell vanuit Azure Portal. Voer vervolgens az account get-access-token
uit. U kunt dit token gebruiken als uw tijdelijke autorisatietoken voor API-tests.
Voorbeeld van een antwoord
{
"id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo",
"type": "Microsoft.CognitiveServices/accounts/deployments",
"name": "gpt-35-turbo",
"sku": {
"name": "Standard",
"capacity": 120
},
"properties": {
"model": {
"format": "OpenAI",
"name": "gpt-35-turbo",
"version": "0613"
},
"versionUpgradeOption": "OnceCurrentVersionExpired",
"capabilities": {
"chatCompletion": "true"
},
"provisioningState": "Succeeded",
"rateLimits": [
{
"key": "request",
"renewalPeriod": 10,
"count": 120
},
{
"key": "token",
"renewalPeriod": 60,
"count": 120000
}
]
},
"systemData": {
"createdBy": "docs@contoso.com",
"createdByType": "User",
"createdAt": "2023-02-28T02:57:15.8951706Z",
"lastModifiedBy": "docs@contoso.com",
"lastModifiedByType": "User",
"lastModifiedAt": "2023-10-31T15:35:53.082912Z"
},
"etag": "\"GUID\""
}
Modellen beheren voor ingerichte implementatietypen
Ingerichte implementaties ondersteunen afzonderlijke procedures voor modelbeheer. Ingerichte beheerprocedures voor implementatiemodellen zijn bedoeld om u de grootste controle te geven over wanneer en hoe u migreert tussen modelversies en modelfamilies. Er zijn momenteel twee methoden beschikbaar voor het beheren van modellen voor ingerichte implementaties: (1) in-place migraties en (2) migraties met meerdere implementaties.
Vereisten
- Controleer of de versie of modelfamilie van het doelmodel wordt ondersteund voor uw bestaande implementatietype. Migraties kunnen alleen plaatsvinden tussen ingerichte implementaties van hetzelfde implementatietype. Raadpleeg de documentatie van het implementatietype voor meer informatie over implementatietypen.
- Valideer de beschikbaarheid van capaciteit voor uw doelmodelversie of modelfamilie voordat u een migratie uitvoert. Raadpleeg de documentatie over capaciteitstransparantie voor meer informatie over het bepalen van de beschikbaarheid van capaciteit.
- Voor migraties met meerdere implementaties controleert u of u voldoende quotum hebt om meerdere implementaties tegelijkertijd te ondersteunen. Raadpleeg de ingerichte quotadocumentatie voor meer informatie over het valideren van quota voor elk ingericht implementatietype.
In-place migraties voor ingerichte implementaties
Met in-place migraties kunt u dezelfde ingerichte implementatienaam en -grootte behouden terwijl u de modelversie of modelfamilie wijzigt die aan die implementatie is toegewezen. Met in-place migraties zorgt Azure OpenAI Service ervoor dat al het verkeer tussen modelversies of modelfamilies gedurende de migratie gedurende een periode van 20-30 minuten wordt gemigreerd. Tijdens het migratievenster wordt in uw ingerichte implementatie de ingerichte status 'bijgewerkt' weergegeven. U kunt uw ingerichte implementatie blijven gebruiken zoals u dat normaal zou doen. Zodra de in-place migratie is voltooid, wordt de ingerichte status bijgewerkt naar Geslaagd, waarmee wordt aangegeven dat al het verkeer is gemigreerd naar de doelmodelversie of modelfamilie.
In-place migratie: modelversie-update
In-place migraties die gericht zijn op het bijwerken van een bestaande ingerichte implementatie naar een nieuwe modelversie binnen dezelfde modelfamilie, worden ondersteund via Azure AI Foundry, REST API en Azure CLI. Als u een in-place migratie wilt uitvoeren die is gericht op een modelversie-update in Azure AI Foundry, selecteert u Implementaties> onder de kolom implementatienaam de implementatienaam van de ingerichte implementatie die u wilt migreren.
Als u een implementatienaam selecteert, worden de eigenschappen voor de modelimplementatie geopend. Selecteer in deze weergave de knop Bewerken , waarin het dialoogvenster Implementatie bijwerken wordt weergegeven. Selecteer de vervolgkeuzelijst voor de modelversie om een nieuwe modelversie in te stellen voor de ingerichte implementatie. Zoals vermeld, wordt de inrichtingsstatus gewijzigd in 'bijwerken' tijdens de migratie en wordt deze teruggezet naar 'geslaagd' zodra de migratie is voltooid.
In-place migratie: modelfamiliewijziging
In-place migratie die is gericht op het bijwerken van een bestaande ingerichte implementatie naar een nieuwe modelfamilie, worden ondersteund via REST API en Azure CLI. Als u een in-place migratie wilt uitvoeren die is gericht op een modelfamiliewijziging, gebruikt u de onderstaande voorbeeldaanvraag als richtlijn. In de aanvraag moet u de modelnaam en modelversie bijwerken voor het doelmodel waarnaar u migreert.
curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment?api-version=2024-10-01 \
-H "Content-Type: application/json" \
-H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
-d '{"sku":{"name":"GlobalProvisionedManaged","capacity":100},"properties": {"model": {"format": "OpenAI","name": "gpt-4o-mini","version": "2024-07-18"}}}'
Voorbeeld van een antwoord
{
"id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment",
"type": "Microsoft.CognitiveServices/accounts/deployments",
"name": "gpt-4o-ptu-deployment",
"sku": {
"name": "GlobalProvisionedManaged",
"capacity": 100
},
"properties": {
"model": {
"format": "OpenAI",
"name": "gpt-4o-mini",
"version": "2024-07-18"
},
"versionUpgradeOption": "OnceCurrentVersionExpired",
"currentCapacity": 100
"capabilities": {
"area": "EUR",
"chatCompletion": "true"
"jsonObjectResponse": "true",
"maxContextToken": "128000",
"maxOutputToken": "16834",
"assistants": "true"
},
"provisioningState": "Updating",
"rateLimits": [
{
"key": "request",
"renewalPeriod": 10,
"count": 300
}
]
},
"systemData": {
"createdBy": "docs@contoso.com",
"createdByType": "User",
"createdAt": "2025-01-28T02:57:15.8951706Z",
"lastModifiedBy": "docs@contoso.com",
"lastModifiedByType": "User",
"lastModifiedAt": "2025-01-29T15:35:53.082912Z"
},
"etag": "\"GUID\""
}
Notitie
Er zijn meerdere manieren om een autorisatietoken te genereren. De eenvoudigste methode voor eerste tests is het starten van Cloud Shell vanuit Azure Portal. Voer vervolgens az account get-access-token
uit. U kunt dit token gebruiken als uw tijdelijke autorisatietoken voor API-tests.
Migraties met meerdere implementaties voor ingerichte implementaties
Met migraties met meerdere implementaties hebt u meer controle over het modelmigratieproces. Met migraties met meerdere implementaties kunt u dicteren hoe snel u uw bestaande verkeer wilt migreren naar de doelmodelversie of modelfamilie op een nieuwe ingerichte implementatie. Het proces voor migratie naar een nieuwe modelversie of modelfamilie met behulp van de migratiebenadering voor meerdere implementaties is als volgt:
- Maak een nieuwe ingerichte implementatie. Voor deze nieuwe implementatie kunt u ervoor kiezen om hetzelfde ingerichte implementatietype te behouden als uw bestaande implementatie of om desgewenst een nieuw implementatietype te selecteren.
- Overgang van verkeer van de bestaande ingerichte implementatie naar de zojuist gemaakte ingerichte implementatie met uw doelmodelversie of modelfamilie totdat al het verkeer wordt offload van de oorspronkelijke implementatie.
- Zodra verkeer naar de nieuwe implementatie is gemigreerd, controleert u of er geen deductieaanvragen worden verwerkt in de vorige ingerichte implementatie door ervoor te zorgen dat de metrische gegevens voor Azure OpenAI-aanvragen geen API-aanroepen tonen die binnen 5-10 minuten na het deductieverkeer worden gemigreerd naar de nieuwe implementatie. Zie de Documentatie over Azure OpenAI bewaken voor meer informatie over deze metrische gegevens.
- Nadat u hebt bevestigd dat er geen deductieoproepen zijn gedaan, verwijdert u de oorspronkelijke ingerichte implementatie.