Azure OpenAI Service-modellen

Artikel
10/25/2024

Azure OpenAI Service wordt mogelijk gemaakt door een diverse set modellen met verschillende mogelijkheden en prijspunten. De beschikbaarheid van modellen verschilt per regio en cloud. Raadpleeg de Azure Government OpenAI-service voor azure Government-modellen.

Modellen	Beschrijving
o1-preview en o1-mini	Beperkte toegangsmodellen, speciaal ontworpen om redenerings- en probleemoplossingstaken aan te pakken met meer focus en mogelijkheden.
GPT-4o & GPT-4o mini & GPT-4 Turbo	De meest geschikte Azure OpenAI-modellen met multimodale versies, die zowel tekst als afbeeldingen als invoer kunnen accepteren.
GPT-4o-Realtime-Preview	Een GPT-4o-model dat ondersteuning biedt voor gespreksinteracties met lage latentie, 'spraak in, spraak uit'.
GPT-4	Een reeks modellen die worden verbeterd op GPT-3.5 en die natuurlijke taal en code kunnen begrijpen en genereren.
GPT-3.5	Een reeks modellen die worden verbeterd op GPT-3 en die natuurlijke taal en code kunnen begrijpen en genereren.
Insluitingen	Een set modellen waarmee tekst kan worden omgezet in numerieke vectorvorm om de gelijkenis van tekst te vergemakkelijken.
DALL-E	Een reeks modellen waarmee oorspronkelijke afbeeldingen uit natuurlijke taal kunnen worden gegenereerd.
Fluisteren	Een reeks modellen in preview waarmee spraak naar tekst kan worden getranscribeerd en vertaald.
Tekst naar spraak (preview)	Een reeks modellen in preview waarmee tekst naar spraak kan worden gesynthetiseert.

beperkte toegang tot o1-preview- en o1-minimodellen

De Azure OpenAI o1-preview en o1-mini modellen zijn speciaal ontworpen om redenerings- en probleemoplossingstaken aan te pakken met meer focus en mogelijkheden. Deze modellen besteden meer tijd aan het verwerken en begrijpen van de aanvraag van de gebruiker, waardoor ze uitzonderlijk sterk zijn op gebieden als wetenschap, codering en wiskunde in vergelijking met eerdere iteraties.

Model-id	Beschrijving	Maximum aantal aanvragen (tokens)	Trainingsgegevens (maximaal)
`o1-preview` (2024-09-12)	Het meest geschikte model in de o1-serie, met verbeterde redeneringsmogelijkheden.	Invoer: 128.000 Uitvoer: 32.768	Oktober 2023
`o1-mini` (2024-09-12)	Een snellere en rendabelere optie in de o1-serie, ideaal voor het coderen van taken waarvoor snelheid en lager resourceverbruik nodig zijn.	Invoer: 128.000 Uitvoer: 65.536	Oktober 2023

Beschikbaarheid

De o1-preview en o1-mini modellen zijn nu beschikbaar voor API-toegang en modelimplementatie. Registratie is vereist en toegang wordt verleend op basis van de geschiktheidscriteria van Microsoft.

Toegang aanvragen: beperkte toegangsmodeltoepassing

Zodra toegang is verleend, moet u voor elk model een implementatie maken.

API-ondersteuning

Ondersteuning voor de o1-seriemodellen is toegevoegd in API-versie 2024-09-01-preview.

De max_tokens parameter is afgeschaft en vervangen door de nieuwe max_completion_tokens parameter. o1-seriemodellen werken alleen met de max_completion_tokens parameter.

Gebruik

Deze modellen ondersteunen momenteel niet dezelfde set parameters als andere modellen die gebruikmaken van de API voor het voltooien van chats. Er wordt momenteel slechts een zeer beperkte subset ondersteund, dus algemene parameters zoals temperature, top_pzijn niet beschikbaar en worden opgenomen, waardoor uw aanvraag mislukt. o1-preview en o1-mini modellen accepteren de systeemberichtrol ook niet als onderdeel van de berichtenmatrix.

Mogelijk moet u uw versie van de OpenAI Python-bibliotheek upgraden om te profiteren van de nieuwe max_completion_tokens parameter.

pip install openai --upgrade

Als u geen toegang hebt tot Microsoft Entra ID voor verificatie, raadpleegt u Hoe u de Azure OpenAI-service configureert met Microsoft Entra ID-verificatie.

from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  azure_ad_token_provider=token_provider,
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

Mogelijk moet u uw versie van de OpenAI Python-bibliotheek upgraden om te profiteren van de nieuwe max_completion_tokens parameter.

pip install openai --upgrade


from openai import AzureOpenAI

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  api_key=os.getenv("AZURE_OPENAI_API_KEY"),  
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

{
  "id": "chatcmpl-AEj7pKFoiTqDPHuxOcirA9KIvf3yz",
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "logprobs": null,
      "message": {
        "content": "Writing your first Python API is an exciting step in developing software that can communicate with other applications. An API (Application Programming Interface) allows different software systems to interact with each other, enabling data exchange and functionality sharing. Here are the steps you should consider when creating your first Python API:\n\n1. **Define the Purpose and Requirements**\n\n   - **Identify the Functionality**: Clearly outline what your API is supposed to do. What data or services will it provide to the users?\n   - **Determine the Endpoints**: Plan the different URLs (endpoints) through which users can access the API functionalities.\n   - **Specify Request and Response Formats**: Decide on the data formats (usually JSON) for incoming requests and outgoing responses.\n\n2. **Choose the Right Framework**\n\n   Python offers several frameworks for building APIs. Two of the most popular are:\n\n   - **Flask**: A lightweight and flexible web framework, great for small to medium-sized APIs.\n   - **FastAPI**: A modern, high-performance framework for building APIs with Python 3.6+ types, offering automatic interactive documentation.\n\n   **Example**:\n   ```bash\n   pip install flask\n   ```\n   or\n   ```bash\n   pip install fastapi uvicorn\n   ```\n\n3. **Set Up the Development Environment**\n\n   - **Create a Virtual Environment**: Isolate your project dependencies using `venv` or `conda`.\n   - **Install Required Packages**: Ensure all necessary libraries and packages are installed.\n\n   **Example**:\n   ```bash\n   python -m venv env\n   source env/bin/activate  # On Windows use `env\\Scripts\\activate`\n   ```\n\n4. **Implement the API Endpoints**\n\n   - **Write the Code for Each Endpoint**: Implement the logic that handles requests and returns responses.\n   - **Use Decorators to Define Routes**: In frameworks like Flask, you use decorators to specify the URL endpoints.\n\n   **Example with Flask**:\n   ```python\n   from flask import Flask, request, jsonify\n\n   app = Flask(__name__)\n\n   @app.route('/hello', methods=['GET'])\n   def hello_world():\n       return jsonify({'message': 'Hello, World!'})\n\n   if __name__ == '__main__':\n       app.run(debug=True)\n   ```\n\n5. **Handle Data Serialization and Deserialization**\n\n   - **Parsing Incoming Data**: Use libraries to parse JSON or other data formats from requests.\n   - **Formatting Output Data**: Ensure that responses are properly formatted in JSON or XML.\n\n6. **Implement Error Handling**\n\n   - **Handle Exceptions Gracefully**: Provide meaningful error messages and HTTP status codes.\n   - **Validate Input Data**: Check for required fields and appropriate data types to prevent errors.\n\n   **Example**:\n   ```python\n   @app.errorhandler(404)\n   def resource_not_found(e):\n       return jsonify(error=str(e)), 404\n   ```\n\n7. **Add Authentication and Authorization (If Necessary)**\n\n   - **Secure Endpoints**: If your API requires, implement security measures such as API keys, tokens (JWT), or OAuth.\n   - **Manage User Sessions**: Handle user login states and permissions appropriately.\n\n8. **Document Your API**\n\n   - **Use Tools Like Swagger/OpenAPI**: Automatically generate interactive API documentation.\n   - **Provide Usage Examples**: Help users understand how to interact with your API.\n\n   **Example with FastAPI**:\n   FastAPI automatically generates docs at `/docs` using Swagger UI.\n\n9. **Test Your API**\n\n   - **Write Unit and Integration Tests**: Ensure each endpoint works as expected.\n   - **Use Testing Tools**: Utilize tools like `unittest`, `pytest`, or API testing platforms like Postman.\n\n   **Example**:\n   ```python\n   import unittest\n   class TestAPI(unittest.TestCase):\n       def test_hello_world(self):\n           response = app.test_client().get('/hello')\n           self.assertEqual(response.status_code, 200)\n   ```\n\n10. **Optimize Performance**\n\n    - **Improve Response Times**: Optimize your code and consider using asynchronous programming if necessary.\n    - **Manage Resource Utilization**: Ensure your API can handle the expected load.\n\n11. **Deploy Your API**\n\n    - **Choose a Hosting Platform**: Options include AWS, Heroku, DigitalOcean, etc.\n    - **Configure the Server**: Set up the environment to run your API in a production setting.\n    - **Use a Production Server**: Instead of the development server, use WSGI servers like Gunicorn or Uvicorn.\n\n    **Example**:\n    ```bash\n    uvicorn main:app --host 0.0.0.0 --port 80\n    ```\n\n12. **Monitor and Maintain**\n\n    - **Logging**: Implement logging to track events and errors.\n    - **Monitoring**: Use monitoring tools to track performance and uptime.\n    - **Update and Patch**: Keep dependencies up to date and patch any security vulnerabilities.\n\n13. **Consider Versioning**\n\n    - **Plan for Updates**: Use versioning in your API endpoints to manage changes without breaking existing clients.\n    - **Example**:\n      ```python\n      @app.route('/v1/hello', methods=['GET'])\n      ```\n\n14. **Gather Feedback and Iterate**\n\n    - **User Feedback**: Encourage users to provide feedback on your API.\n    - **Continuous Improvement**: Use the feedback to make improvements and add features.\n\n**Additional Tips**:\n\n- **Keep It Simple**: Start with a minimal viable API and expand functionality over time.\n- **Follow RESTful Principles**: Design your API according to REST standards to make it intuitive and standard-compliant.\n- **Security Best Practices**: Always sanitize inputs and protect against common vulnerabilities like SQL injection and cross-site scripting (XSS).\nBy following these steps, you'll be well on your way to creating a functional and robust Python API. Good luck with your development!",
        "refusal": null,
        "role": "assistant",
        "function_call": null,
        "tool_calls": null
      },
      "content_filter_results": {
        "hate": {
          "filtered": false,
          "severity": "safe"
        },
        "protected_material_code": {
          "filtered": false,
          "detected": false
        },
        "protected_material_text": {
          "filtered": false,
          "detected": false
        },
        "self_harm": {
          "filtered": false,
          "severity": "safe"
        },
        "sexual": {
          "filtered": false,
          "severity": "safe"
        },
        "violence": {
          "filtered": false,
          "severity": "safe"
        }
      }
    }
  ],
  "created": 1728073417,
  "model": "o1-preview-2024-09-12",
  "object": "chat.completion",
  "service_tier": null,
  "system_fingerprint": "fp_503a95a7d8",
  "usage": {
    "completion_tokens": 1843,
    "prompt_tokens": 20,
    "total_tokens": 1863,
    "completion_tokens_details": {
      "audio_tokens": null,
      "reasoning_tokens": 448
    },
    "prompt_tokens_details": {
      "audio_tokens": null,
      "cached_tokens": 0
    }
  },
  "prompt_filter_results": [
    {
      "prompt_index": 0,
      "content_filter_results": {
        "custom_blocklists": {
          "filtered": false
        },
        "hate": {
          "filtered": false,
          "severity": "safe"
        },
        "jailbreak": {
          "filtered": false,
          "detected": false
        },
        "self_harm": {
          "filtered": false,
          "severity": "safe"
        },
        "sexual": {
          "filtered": false,
          "severity": "safe"
        },
        "violence": {
          "filtered": false,
          "severity": "safe"
        }
      }
    }
  ]
}

Regionale beschikbaarheid

Beschikbaar voor standaard- en wereldwijde standaardimplementatie in VS - oost, VS - oost2, VS - noord-centraal, VS - zuid-centraal, Zweden - centraal, VS - west en VS - west3 voor goedgekeurde klanten.

GPT-4o-Realtime-Preview

Het gpt-4o-realtime-preview model maakt deel uit van de GPT-4o-modelfamilie en ondersteunt gespreksinteracties met lage latentie, 'spraak in, spraak uit'. GPT-4o-audio is ontworpen om realtime gespreksinteracties met lage latentie af te handelen, waardoor het een uitstekende keuze is voor ondersteuningsmedewerkers, assistenten, vertalers en andere gebruiksvoorbeelden die zeer snel moeten reageren met een gebruiker.

GPT-4o audio is beschikbaar in de regio's VS - oost 2 (eastus2) en Zweden - centraal (swedencentral). Als u GPT-4o-audio wilt gebruiken, moet u een bestaande resource maken of gebruiken in een van de ondersteunde regio's.

Wanneer uw resource is gemaakt, kunt u het GPT-4o-audiomodel implementeren . Als u een programmatische implementatie uitvoert, is gpt-4o-realtime-previewde naam van het model. Zie de GPT-4o-audiodocumentatie voor meer informatie over het gebruik van GPT-4o audio.

Details over het maximum aantal aanvraagtokens en trainingsgegevens zijn beschikbaar in de volgende tabel.

Model-id	Beschrijving	Maximum aantal aanvragen (tokens)	Trainingsgegevens (maximaal)
`gpt-4o-realtime-preview` (2024-10-01-preview) GPT-4o audio	Audiomodel voor realtime audioverwerking	Invoer: 128.000 Uitvoer: 4.096	Oktober 2023

GPT-4o en GPT-4 Turbo

GPT-4o integreert tekst en afbeeldingen in één model, zodat deze meerdere gegevenstypen tegelijk kan verwerken. Deze multimodale benadering verbetert de nauwkeurigheid en reactiesnelheid in interacties tussen menselijke computers. GPT-4o komt overeen met GPT-4 Turbo in engelse tekst- en coderingstaken en biedt superieure prestaties in niet-Engelse talen en vision-taken, waardoor nieuwe benchmarks voor AI-mogelijkheden worden ingesteld.

Hoe kan ik toegang tot de GPT-4o- en GPT-4o minimodellen?

GPT-4o en GPT-4o mini zijn beschikbaar voor standaard - en wereldwijde modelimplementatie.

U moet een bestaande resource maken of gebruiken in een ondersteunde standaard- of globale standaardregio waar het model beschikbaar is.

Wanneer uw resource is gemaakt, kunt u de GPT-4o-modellen implementeren . Als u een programmatische implementatie uitvoert, zijn de modelnamen :

gpt-4oVersie 2024-08-06
gpt-4o, Versie 2024-05-13
gpt-4o-miniVersie 2024-07-18

GPT-4 Turbo

GPT-4 Turbo is een groot multimodale model (accepteren van tekst- of afbeeldingsinvoer en het genereren van tekst) die moeilijke problemen met een grotere nauwkeurigheid kan oplossen dan een van de vorige modellen van OpenAI. Zoals GPT-3.5 Turbo en oudere GPT-4 modellen GPT-4 Turbo is geoptimaliseerd voor chatten en werkt goed voor traditionele voltooiingstaken.

De nieuwste GA-release van GPT-4 Turbo is:

gpt-4Versie: turbo-2024-04-09

Dit is de vervanging voor de volgende preview-modellen:

gpt-4Versie: 1106-Preview
gpt-4Versie: 0125-Preview
gpt-4Versie: vision-preview

Verschillen tussen OpenAI en Azure OpenAI GPT-4 Turbo GA-modellen

OpenAI's versie van het nieuwste 0409 turbomodel ondersteunt JSON-modus en functie-aanroepen voor alle deductieaanvragen.
De versie van Azure OpenAI van de meest recente turbo-2024-04-09 versie biedt momenteel geen ondersteuning voor het gebruik van de JSON-modus en functie-aanroepen bij het maken van deductieaanvragen met afbeeldingsinvoer (vision). Invoeraanvragen op basis van tekst (aanvragen zonder image_url en inline-afbeeldingen) ondersteunen de JSON-modus en functie-aanroepen.

Verschillen met gpt-4 vision-preview

Integratie van azure AI-specifieke Vision-verbeteringen met GPT-4 Turbo met Vision wordt niet ondersteund voor gpt-4 versie: turbo-2024-04-09. Dit omvat Optical Character Recognition (OCR), objectaarding, videoprompts en verbeterde verwerking van uw gegevens met afbeeldingen.

Belangrijk

Preview-functies voor visuele verbeteringen, waaronder OCR (Optical Character Recognition), objectgronding, videoprompts worden buiten gebruik gesteld en zijn niet meer beschikbaar zodra gpt-4 versie: vision-preview wordt bijgewerkt naar turbo-2024-04-09. Als u momenteel afhankelijk bent van een van deze preview-functies, is deze automatische modelupgrade een belangrijke wijziging.

Beheerde beschikbaarheid van GPT-4 Turbo ingericht

gpt-4Versie: turbo-2024-04-09 is beschikbaar voor zowel standaard- als ingerichte implementaties. Momenteel biedt de ingerichte versie van dit model geen ondersteuning voor aanvragen voor afbeeldings-/visiondeductie. Ingerichte implementaties van dit model accepteren alleen tekstinvoer. Standaardmodelimplementaties accepteren zowel tekst- als afbeeldings-/visiondeductieaanvragen.

GPT-4 Turbo implementeren met Vision GA

Als u het GA-model wilt implementeren vanuit de gebruikersinterface van Studio, selecteert en kiest u GPT-4 vervolgens de turbo-2024-04-09 versie in de vervolgkeuzelijst. Het standaardquotum voor het gpt-4-turbo-2024-04-09 model is hetzelfde als het huidige quotum voor GPT-4-Turbo. Zie de regionale quotumlimieten.

GPT-4

GPT-4 is de voorganger van GPT-4 Turbo. Zowel de GPT-4- als GPT-4 Turbo-modellen hebben een basismodelnaam van gpt-4. U kunt onderscheid maken tussen de GPT-4- en Turbo-modellen door de modelversie te bekijken.

gpt-4Versie 0314
gpt-4Versie 0613
gpt-4-32kVersie 0613

U kunt de contextlengte van het token zien die door elk model wordt ondersteund in de overzichtstabel van het model.

GPT-4- en GPT-4 Turbo-modellen

Deze modellen kunnen alleen worden gebruikt met de CHAT-voltooiings-API.

Zie modelversies voor meer informatie over hoe Azure OpenAI Service modelversie-upgrades verwerkt en hoe u met modellen werkt om te leren hoe u de modelversie-instellingen van uw GPT-4-implementaties kunt bekijken en configureren.

Model-id	Beschrijving	Maximum aantal aanvragen (tokens)	Trainingsgegevens (maximaal)
`gpt-4o` (2024-08-06) GPT-4o (Omni)	Nieuwste grote GA-model - Gestructureerde uitvoer - Tekst, afbeeldingsverwerking - JSON-modus - parallelle functie aanroepen - Verbeterde nauwkeurigheid en reactiesnelheid - Pariteit met Engelse tekst- en coderingstaken vergeleken met GPT-4 Turbo met Vision - Superieure prestaties in niet-Engelse talen en in vision-taken	Invoer: 128.000 Uitvoer: 16.384	Oktober 2023
`gpt-4o-mini` (2024-07-18) GPT-4o mini	Nieuwste kleine GA-model - Snel, goedkoop, geschikt model ideaal voor het vervangen van GPT-3.5 Turbo-modellen. - Tekst, afbeeldingsverwerking - JSON-modus - parallelle functie aanroepen	Invoer: 128.000 Uitvoer: 16.384	Oktober 2023
`gpt-4o` (2024-05-13) GPT-4o (Omni)	Tekst, afbeeldingsverwerking - JSON-modus - parallelle functie aanroepen - Verbeterde nauwkeurigheid en reactiesnelheid - Pariteit met Engelse tekst- en coderingstaken vergeleken met GPT-4 Turbo met Vision - Superieure prestaties in niet-Engelse talen en in vision-taken	Invoer: 128.000 Uitvoer: 4.096	Oktober 2023
`gpt-4` (turbo-2024-04-09) GPT-4 Turbo met Vision	Nieuw GA-model - Vervanging voor alle vorige GPT-4 preview-modellen (`vision-preview`, `1106-Preview`, `0125-Preview`). - De beschikbaarheid van functies verschilt momenteel, afhankelijk van de invoermethode en het implementatietype.	Invoer: 128.000 Uitvoer: 4.096	dec. 2023
`gpt-4` (0125-Preview)* GPT-4 Turbo Preview	Voorbeeldmodel -Vervangt 1106-Preview - Betere prestaties van het genereren van code - Vermindert gevallen waarin het model een taak niet voltooit - JSON-modus - parallelle functie aanroepen - reproduceerbare uitvoer (preview)	Invoer: 128.000 Uitvoer: 4.096	dec. 2023
`gpt-4` (vision-preview) GPT-4 Turbo met Vision Preview	Voorbeeldmodel - Accepteert tekst- en afbeeldingsinvoer. - Ondersteunt verbeteringen - JSON-modus - parallelle functie aanroepen - reproduceerbare uitvoer (preview)	Invoer: 128.000 Uitvoer: 4.096	apr. 2023
`gpt-4` (1106-preview) GPT-4 Turbo Preview	Voorbeeldmodel - JSON-modus - parallelle functie aanroepen - reproduceerbare uitvoer (preview)	Invoer: 128.000 Uitvoer: 4.096	apr. 2023
`gpt-4-32k` (0613)	Ouder GA-model - Eenvoudige functie aanroepen met hulpprogramma's	32.768	Sep 2021
`gpt-4` (0613)	Ouder GA-model - Eenvoudige functie aanroepen met hulpprogramma's	8192	Sep 2021
`gpt-4-32k`(0314)	Ouder GA-model - Buitengebruikstellingsgegevens	32.768	Sep 2021
`gpt-4` (0314)	Ouder GA-model - Buitengebruikstellingsgegevens	8192	Sep 2021

Let op

We raden u niet aan preview-modellen in productie te gebruiken. We zullen alle implementaties van preview-modellen upgraden naar toekomstige preview-versies of naar de nieuwste stabiele GA-versie. Modellen die zijn aangewezen preview volgen niet de standaardlevenscyclus van het Azure OpenAI-model.

GPT-4 versie 0125-preview is een bijgewerkte versie van de GPT-4 Turbo preview die eerder is uitgebracht als versie 1106-preview.
GPT-4 versie 0125-preview voltooit taken zoals het genereren van code volledig in vergelijking met gpt-4-1106-preview. Hierdoor kunnen klanten, afhankelijk van de taak, merken dat GPT-4-0125-preview meer uitvoer genereert in vergelijking met de gpt-4-1106-preview. We raden klanten aan de uitvoer van het nieuwe model te vergelijken. GPT-4-0125-preview behandelt ook bugs in gpt-4-1106-preview met UTF-8-verwerking voor niet-Engelse talen.
GPT-4-versie turbo-2024-04-09 is de nieuwste GA-release en vervangt 0125-Preview, 1106-previewen vision-preview.

Belangrijk

De GPT-4 (gpt-4) versies1106-Preview, 0125-Previewen vision-preview worden in de toekomst geüpgraded met een stabiele versie.gpt-4

Implementaties van gpt-4 versies 1106-Previewen 0125-Previewvision-preview ingesteld op 'Automatisch bijwerken naar standaard' en 'Upgrade wanneer verlopen' wordt bijgewerkt nadat de stabiele versie is uitgebracht. Voor elke implementatie vindt er een upgrade van een modelversie plaats zonder onderbreking van de service voor API-aanroepen. Upgrades worden gefaseerd per regio en het volledige upgradeproces duurt naar verwachting 2 weken.
Implementaties van gpt-4 versies 1106-Previewen 0125-Previewvision-preview ingesteld op 'Geen autoupgrade' worden niet bijgewerkt en worden niet meer uitgevoerd wanneer de preview-versie in de regio wordt bijgewerkt. Zie buitengebruikstelling en afschaffingen van Azure OpenAI-modellen voor meer informatie over de timing van de upgrade.

GPT-3.5

GPT-3.5-modellen kunnen natuurlijke taal of code begrijpen en genereren. Het meest geschikte en rendabele model in de GPT-3.5-familie is GPT-3.5 Turbo, die is geoptimaliseerd voor chatten en werkt ook goed voor traditionele voltooiingstaken. GPT-3.5 Turbo is beschikbaar voor gebruik met de API voor chatvoltooiingen. GPT-3.5 Turbo Instruct heeft vergelijkbare mogelijkheden als text-davinci-003 het gebruik van de Completions-API in plaats van de Chat Completions-API. We raden u aan GPT-3.5 Turbo en GPT-3.5 Turbo Instruct te gebruiken voor oudere GPT-3.5- en GPT-3-modellen.

Model-id	Beschrijving	Maximum aantal aanvragen (tokens)	Trainingsgegevens (maximaal)
`gpt-35-turbo` (0125) NIEUW	Meest recente GA-model - JSON-modus - parallelle functie aanroepen - reproduceerbare uitvoer (preview) - Hogere nauwkeurigheid bij het reageren in aangevraagde indelingen. - Oplossing voor een fout die een tekstcoderingsprobleem veroorzaakte voor niet-Engelstalige functie-aanroepen.	Invoer: 16.385 Uitvoer: 4.096	Sep 2021
`gpt-35-turbo` (1106)	Ouder GA-model - JSON-modus - parallelle functie aanroepen - reproduceerbare uitvoer (preview)	Invoer: 16.385 Uitvoer: 4.096	Sep 2021
`gpt-35-turbo-instruct` (0914)	Eindpunt voor voltooiingen alleen - Vervanging van verouderde voltooiingsmodellen	4,097	Sep 2021
`gpt-35-turbo-16k` (0613)	Ouder GA-model - Eenvoudige functie aanroepen met hulpprogramma's	16,384	Sep 2021
`gpt-35-turbo` (0613)	Ouder GA-model - Eenvoudige functie aanroepen met hulpprogramma's	4096	Sep 2021
`gpt-35-turbo`¹ (0301)	Ouder GA-model - Buitengebruikstellingsgegevens	4096	Sep 2021

Bekijk onze uitgebreide procedures voor meer informatie over hoe u kunt communiceren met GPT-3.5 Turbo en de API voor chatvoltooiingen.

¹ Dit model accepteert aanvragen > 4.096 tokens. Het wordt niet aanbevolen om de limiet van 4096 invoertoken te overschrijden, omdat de nieuwere versie van het model wordt beperkt tot 4.096 tokens. Als u problemen ondervindt bij het overschrijden van 4096 invoertokens met dit model, wordt deze configuratie niet officieel ondersteund.

Insluitingen

text-embedding-3-large is het meest recente en meest geschikte insluitmodel. Upgraden tussen insluitingsmodellen is niet mogelijk. Als u wilt overstappen van het gebruik text-embedding-ada-002 naar het text-embedding-3-large gebruik, moet u nieuwe insluitingen genereren.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

Bij het testen rapporteert OpenAI zowel de grote als de kleine derde generatie embeddingsmodellen betere gemiddelde prestaties voor het ophalen van meerdere talen met de MIRACL-benchmark , terwijl de prestaties voor Engelse taken met de MTEB-benchmark nog steeds behouden blijven.

Evaluatiebenchmark	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
MIRACL-gemiddelde	31.4	44.0	54.9
MTEB-gemiddelde	61.0	62.3	64.6

De insluitingsmodellen van de derde generatie ondersteunen het verminderen van de grootte van het insluiten via een nieuwe dimensions parameter. Meestal zijn grotere insluitingen duurder vanuit reken-, geheugen- en opslagperspectief. Als u het aantal dimensies kunt aanpassen, hebt u meer controle over de totale kosten en prestaties. De dimensions parameter wordt niet ondersteund in alle versies van de OpenAI 1.x Python-bibliotheek om te profiteren van deze parameter, raden we aan om een upgrade uit te voeren naar de nieuwste versie: pip install openai --upgrade.

De MTEB-benchmarktests van OpenAI hebben vastgesteld dat zelfs wanneer de dimensies van het derde generatiemodel worden verlaagd tot minder dan text-embeddings-ada-002 1536 dimensies, de prestaties iets beter blijven.

DALL-E

De DALL-E-modellen genereren afbeeldingen op basis van tekstprompts die de gebruiker biedt. DALL-E 3 is algemeen beschikbaar voor gebruik met de REST API's. DALL-E 2 en DALL-E 3 met client-SDK's zijn in preview.

Fluisteren

De Fluistermodellen kunnen worden gebruikt voor spraak-naar-tekst.

U kunt het Whisper-model ook gebruiken via azure AI Speech-batchtranscriptie-API. Bekijk wat is het Fluistermodel? voor meer informatie over wanneer u Azure AI Speech versus Azure OpenAI Service gebruikt.

Tekst naar spraak (preview)

De OpenAI-tekst naar spraakmodellen, momenteel als preview-versie, kan worden gebruikt om tekst naar spraak te synthetiseren.

U kunt de OpenAI-tekst ook gebruiken voor spraakstemmen via Azure AI Speech. Zie OpenAI-tekst naar spraakstemmen via Azure OpenAI Service of via azure AI Speech Guide voor meer informatie.

Overzichtstabel en beschikbaarheid van regio's model

Modellen op implementatietype

Azure OpenAI biedt klanten keuzes in de hostingstructuur die past bij hun bedrijfs- en gebruikspatronen. De service biedt twee hoofdtypen van implementatie:

Standard wordt aangeboden met een globale implementatieoptie, waarbij verkeer wereldwijd wordt gerouteerd om een hogere doorvoer te bieden.
Ingericht wordt ook aangeboden met een globale implementatieoptie, zodat klanten ingerichte doorvoereenheden kunnen aanschaffen en implementeren in de wereldwijde Infrastructuur van Azure.

Alle implementaties kunnen exact dezelfde deductiebewerkingen uitvoeren, maar de facturering, schaal en prestaties verschillen aanzienlijk. Zie de handleiding voor implementatietypen van Azure OpenAI voor meer informatie over azure OpenAI-implementatietypen.

Wereldwijde beschikbaarheid van standaardmodellen

Regio	o1-preview, 2024-09-12	o1-mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4o-realtime-preview, 2024-10-01	gpt-4, turbo-2024-04-09
australiaeast	-	-	✅	-	✅	-	✅
brazilsouth	-	-	✅	-	✅	-	✅
canadaeast	-	-	✅	-	✅	-	✅
eastus	✅	✅	✅	✅	✅	-	✅
eastus2	✅	✅	✅	✅	✅	✅	✅
francecentral	-	-	✅	-	✅	-	✅
germanywestcentral	-	-	✅	-	✅	-	✅
japaneast	-	-	✅	-	✅	-	✅
koreacentral	-	-	✅	-	✅	-	✅
northcentralus	✅	✅	✅	✅	✅	-	✅
norwayeast	-	-	✅	-	✅	-	✅
Polencentral	-	-	✅	-	✅	-	✅
southafricanorth	-	-	✅	-	✅	-	✅
US - zuid-centraal	✅	✅	✅	✅	✅	-	✅
southindia	-	-	✅	-	✅	-	✅
spaincentral	-	-	✅	✅	✅	-	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	-	-	✅	-	✅	-	✅
uaenorth	-	-	✅	-	✅	-	✅
uksouth	-	-	✅	-	✅	-	✅
westeurope	-	-	✅	-	✅	-	✅
westus	✅	✅	✅	✅	✅	-	✅
westus3	✅	✅	✅	✅	✅	-	✅

Beschikbaarheid van wereldwijd ingerichte beheerde modellen

Regio	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18
australiaeast	✅	✅
brazilsouth	✅	✅
canadacentral	✅	✅
canadaeast	✅	✅
eastus	✅	✅
eastus2	✅	✅
francecentral	✅	✅
germanywestcentral	✅	✅
japaneast	✅	✅
koreacentral	✅	✅
northcentralus	✅	✅
norwayeast	✅	✅
Polencentral	✅	✅
southafricanorth	✅	✅
US - zuid-centraal	✅	✅
southindia	✅	✅
spaincentral	✅	✅
swedencentral	✅	✅
switzerlandnorth	✅	✅
zwitserlandwest	✅	✅
uksouth	✅	✅
westeurope	✅	✅
westus	✅	✅
westus3	✅	✅

Wereldwijde beschikbaarheid van batchmodellen

Regio	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, turbo-2024-04-09	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125
australiaeast	✅	✅	✅	✅	✅	✅	✅	✅
canadaeast	✅	✅	✅	✅	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	✅	✅	✅	✅	✅
japaneast	✅	✅	✅	✅	✅	✅	✅	✅
koreacentral	✅	✅	✅	✅	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅
norwayeast	✅	✅	✅	✅	✅	✅	✅	✅
US - zuid-centraal	✅	✅	✅	✅	✅	✅	✅	✅
southindia	✅	✅	✅	✅	✅	✅	✅	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	✅	✅	✅	✅	✅	✅	✅	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅
westeurope	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	✅	✅	✅	✅	✅

Beschikbaarheid van standaardmodel voor gegevenszones

Regio	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18
eastus	✅	✅	✅
eastus2	✅	✅	✅
francecentral	✅	✅	✅
germanywestcentral	✅	✅	✅
northcentralus	✅	✅	✅
Polencentral	✅	✅	✅
US - zuid-centraal	✅	✅	✅
spaincentral	✅	✅	✅
swedencentral	✅	✅	✅
westeurope	✅	✅	✅
westus	✅	✅	✅
westus3	✅	✅	✅

Beschikbaarheid van standaardimplementatiemodel

Regio	o1-preview, 2024-09-12	o1-mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, vision-preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0301	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613	gpt-35-turbo-instruct, 0914	tekst insluiten-3-klein, 1	tekst-insluiten-3-groot, 1	text-embedding-ada-002, 1	text-embedding-ada-002, 2	dall-e-2, 2.0	dall-e-3, 3.0	babbage-002, 1	davinci-002, 1	tts, 001	tts-hd, 001	fluisteren, 001
australiaeast	-	-	-	-	-	✅	✅	-	✅	-	✅	-	✅	✅	-	✅	-	-	-	-	✅	-	✅	-	-	-	-	-
brazilsouth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-
canadaeast	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	✅	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	-
eastus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-
eastus2	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	✅
francecentral	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	-	✅	-	-	✅	-	✅	-	-	-	-	-	-	-
japaneast	-	-	-	-	-	-	-	-	✅	-	-	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	-
northcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	✅	-	✅	✅	-	-	-	-	✅	-	-	✅	✅	✅	✅	✅
norwayeast	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-	-	-	✅	-	✅	-	-	-	-	-	-	✅
Polencentral	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-
southafricanorth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-
US - zuid-centraal	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	-	-	✅	-	-	-	-	✅	✅	-	-	-	-	-	-	-
southindia	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	-	-	-	-	✅	-	✅	-	-	-	-	-	-	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	✅	✅	-	✅	✅	-	✅	-	✅	-	✅	✅	✅	✅	✅	✅
switzerlandnorth	-	-	-	-	-	✅	-	-	✅	-	✅	-	✅	-	-	✅	-	-	✅	-	✅	-	-	-	-	-	-	✅
uaenorth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅
uksouth	-	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	-	-	-	-	-
westeurope	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅
westus	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	-	-	✅	✅	-	-	-	-	-	✅	-	-	-	-	-	-	-
westus3	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	✅	-	-	-	✅	-	✅	-	-	-	-	-	-	-

Beschikbaarheid van ingerichte implementatiemodellen

Regio	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125
australiaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
brazilsouth	✅	-	✅	✅	✅	✅	-	✅	✅	-
canadacentral	-	-	-	✅	-	-	-	✅	-	✅
canadaeast	✅	-	✅	✅	✅	-	✅	-	✅	-
eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	✅	✅	✅	-	✅	-	✅
germanywestcentral	✅	-	-	✅	✅	✅	✅	✅	✅	-
japaneast	✅	✅	✅	-	✅	✅	✅	-	-	✅
koreacentral	✅	✅	✅	✅	-	-	✅	✅	✅	-
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
norwayeast	✅	-	✅	✅	-	✅	-	✅	-	-
Polencentral	✅	-	-	✅	✅	✅	✅	✅	✅	✅
southafricanorth	✅	-	-	✅	✅	-	✅	✅	✅	-
US - zuid-centraal	✅	-	-	✅	✅	✅	✅	✅	✅	✅
southindia	✅	-	✅	✅	✅	✅	-	✅	✅	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
zwitserlandwest	-	-	-	-	-	-	-	-	-	✅
uaenorth	✅	-	-	-	✅	-	-	-	✅	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	-	✅	✅	✅	✅	✅	✅	✅

Notitie

De ingerichte versie van gpt-4 versie: turbo-2024-04-09 is momenteel beperkt tot alleen tekst.

Zie onze richtlijnen voor ingerichte implementaties voor meer informatie over ingerichte implementaties.

Deze tabel bevat geen gedetailleerde regionale beschikbaarheidsgegevens. Raadpleeg de sectie voor het afstemmen van deze informatie.

Standaardmodellen per eindpunt

Chatvoltooiingen

Regio	o1-preview, 2024-09-12	o1-mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, vision-preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0301	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613
australiaeast	-	-	-	-	-	✅	✅	-	✅	-	✅	-	✅	✅	-	✅
canadaeast	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	✅	-	✅	✅
eastus2	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	✅	-	✅	✅
francecentral	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	-	✅
japaneast	-	-	-	-	-	-	-	-	✅	-	-	-	✅	-	✅	✅
northcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	✅	-	✅	✅
norwayeast	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-
US - zuid-centraal	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	-	-	✅	-
southindia	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	-	-
swedencentral	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	✅	✅	-	✅
switzerlandnorth	-	-	-	-	-	✅	-	-	✅	-	✅	-	✅	-	-	✅
uksouth	-	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅
westeurope	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-
westus	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	-	-	✅	✅	-
westus3	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	✅	-

Beschikbaarheid van GPT-4- en GPT-4 Turbo-modellen

Klanttoegang selecteren

Naast de bovenstaande regio's die beschikbaar zijn voor alle Azure OpenAI-klanten, hebben sommige vooraf bestaande klanten toegang gekregen tot versies van GPT-4 in extra regio's:

Modelleren	Regio
`gpt-4` (0314) `gpt-4-32k` (0314)	VS - oost Frankrijk - centraal VS - zuid-centraal Verenigd Koninkrijk Zuid
`gpt-4` (0613) `gpt-4-32k` (0613)	VS - oost VS - oost 2 Japan - oost Verenigd Koninkrijk Zuid

GPT-3.5-modellen

Modellen voor insluiten

Regio	tekst insluiten-3-klein, 1	tekst-insluiten-3-groot, 1	text-embedding-ada-002, 1	text-embedding-ada-002, 2
australiaeast	-	-	-	✅
brazilsouth	-	-	-	✅
canadaeast	✅	✅	-	✅
eastus	✅	✅	✅	✅
eastus2	✅	✅	-	✅
francecentral	-	✅	-	✅
japaneast	✅	✅	-	✅
northcentralus	-	-	-	✅
norwayeast	-	✅	-	✅
Polencentral	-	✅	-	-
southafricanorth	-	-	-	✅
US - zuid-centraal	-	-	✅	✅
southindia	-	✅	-	✅
swedencentral	-	✅	-	✅
switzerlandnorth	-	✅	-	✅
uaenorth	-	-	-	✅
uksouth	-	✅	-	✅
westeurope	-	-	-	✅
westus	-	-	-	✅
westus3	-	✅	-	✅

Deze modellen kunnen alleen worden gebruikt met API-aanvragen voor insluiten.

Notitie

text-embedding-3-large is het meest recente en meest geschikte insluitmodel. Upgraden tussen insluitingsmodellen is niet mogelijk. Als u wilt migreren van gebruik text-embedding-ada-002 naar, text-embedding-3-large moet u nieuwe insluitingen genereren.

Model-id	Maximum aantal aanvragen (tokens)	Uitvoerdimensies	Trainingsgegevens (tot)
`text-embedding-ada-002` (versie 2)	8192	1536	Sep 2021
`text-embedding-ada-002` (versie 1)	2,046	1536	Sep 2021
`text-embedding-3-large`	8192	3072	Sep 2021
`text-embedding-3-small`	8192	1536	Sep 2021

Notitie

Bij het verzenden van een matrix met invoer voor insluiten is het maximum aantal invoeritems in de matrix per aanroep naar het eindpunt voor insluiten 2048.

Modellen voor het genereren van installatiekopieën

Regio	dall-e-2, 2.0	dall-e-3, 3.0
australiaeast	-	✅
eastus	✅	✅
swedencentral	-	✅

DALL-E-modellen

Model-id	Maximum aantal aanvragen (tekens)
dalle2 (preview)	1.000
dall-e-3	4000

Audiomodellen

Regio	tts, 001	tts-hd, 001	fluisteren, 001
eastus2	-	-	✅
northcentralus	✅	✅	✅
norwayeast	-	-	✅
southindia	-	-	✅
swedencentral	✅	✅	✅
switzerlandnorth	-	-	✅
uaenorth	-	-	✅
westeurope	-	-	✅

Fluistermodellen

Model-id	Maximale aanvraag (bestandsgrootte van audio)
`whisper`	25 MB

Tekst-naar-spraakmodellen (preview)

Model-id	Beschrijving
`tts`	De nieuwste Azure OpenAI-tekst naar spraakmodel, geoptimaliseerd voor snelheid.
`tts-hd`	De nieuwste Azure OpenAI-tekst naar spraakmodel, geoptimaliseerd voor kwaliteit.

Voltooiingsmodellen

babbage-002 en davinci-002 zijn niet getraind om instructies te volgen. Het uitvoeren van query's op deze basismodellen moet alleen worden uitgevoerd als referentiepunt voor een nauwkeurig afgestemde versie om de voortgang van uw training te evalueren.

Regio	gpt-35-turbo-instruct, 0914	babbage-002, 1	davinci-002, 1
eastus	✅	-	-
northcentralus	-	✅	✅
swedencentral	✅	✅	✅

Modellen verfijnen

Notitie

gpt-35-turbo - Het afstemmen van dit model is beperkt tot een subset van regio's en is niet beschikbaar in elke regio waar het basismodel beschikbaar is.

De ondersteunde regio's voor het afstemmen kunnen variëren als u Azure OpenAI-modellen gebruikt in een AI Studio-project versus buiten een project.

Model-id	Regio's verfijnen	Maximum aantal aanvragen (tokens)	Trainingsgegevens (maximaal)
`babbage-002`	VS - noord-centraal Zweden - centraal Zwitserland - west	16,384	Sep 2021
`davinci-002`	VS - noord-centraal Zweden - centraal Zwitserland - west	16,384	Sep 2021
`gpt-35-turbo` (0613)	VS - oost 2 VS - noord-centraal Zweden - centraal Zwitserland - west	4096	Sep 2021
`gpt-35-turbo` (1106)	VS - oost 2 VS - noord-centraal Zweden - centraal Zwitserland - west	Invoer: 16.385 Uitvoer: 4.096	Sep 2021
`gpt-35-turbo` (0125)	VS - oost 2 VS - noord-centraal Zweden - centraal Zwitserland - west	16,385	Sep 2021
`gpt-4` (0613) ¹	VS - noord-centraal Zweden - centraal	8192	Sep 2021
`gpt-4o-mini` (2024-07-18)	VS - noord-centraal Zweden - centraal	Invoer: 128.000 Uitvoer: 16.384 Lengte van trainingsvoorbeeld: 64.536	Oktober 2023
`gpt-4o` (2024-08-06)	VS - oost 2 VS - noord-centraal Zweden - centraal	Invoer: 128.000 Uitvoer: 16.384 Lengte van trainingsvoorbeeld: 64.536	Oktober 2023

¹ GPT-4 is momenteel beschikbaar als openbare preview.

Assistenten (preview)

Voor assistenten hebt u een combinatie van een ondersteund model en een ondersteunde regio nodig. Voor bepaalde hulpprogramma's en mogelijkheden zijn de nieuwste modellen vereist. De volgende modellen zijn beschikbaar in de Assistent-API, SDK en Azure AI Studio. De volgende tabel is voor betalen per gebruik. Zie ingerichte doorvoer voor informatie over de beschikbaarheid van ingerichte doorvoereenheden (PTU). De vermelde modellen en regio's kunnen worden gebruikt met zowel Assistenten v1 als v2. U kunt globale standaardmodellen gebruiken als ze worden ondersteund in de onderstaande regio's.

Regio	`gpt-35-turbo (0613)`	`gpt-35-turbo (1106)`	`fine tuned gpt-3.5-turbo-0125`	`gpt-4 (0613)`	`gpt-4 (1106)`	`gpt-4 (0125)`	`gpt-4o (2024-05-13)`	`gpt-4o-mini (2024-07-18)`
Australië - oost	✅	✅		✅	✅
VS - oost	✅					✅	✅	✅
VS - oost 2	✅		✅	✅	✅		✅
Frankrijk - centraal	✅	✅		✅	✅
Japan East	✅
Noorwegen - oost					✅
Zweden - centraal	✅	✅	✅	✅	✅		✅
Verenigd Koninkrijk Zuid	✅	✅			✅	✅
VS - west		✅			✅		✅
US - west 3					✅		✅

Buitengebruikstelling van model

Raadpleeg de handleiding voor buitengebruikstelling van modellen voor de meest recente informatie over buitengebruikstelling van modellen.

Delen via

Azure OpenAI Service-modellen

beperkte toegang tot o1-preview- en o1-minimodellen

Beschikbaarheid

API-ondersteuning

Gebruik

Regionale beschikbaarheid

GPT-4o-Realtime-Preview

GPT-4o en GPT-4 Turbo

Hoe kan ik toegang tot de GPT-4o- en GPT-4o minimodellen?

GPT-4 Turbo

Verschillen tussen OpenAI en Azure OpenAI GPT-4 Turbo GA-modellen

Verschillen met gpt-4 vision-preview

Beheerde beschikbaarheid van GPT-4 Turbo ingericht

GPT-4 Turbo implementeren met Vision GA

GPT-4

GPT-4- en GPT-4 Turbo-modellen

GPT-3.5

Insluitingen

DALL-E

Fluisteren

Tekst naar spraak (preview)

Overzichtstabel en beschikbaarheid van regio's model

Modellen op implementatietype

Wereldwijde beschikbaarheid van standaardmodellen

Standaardmodellen per eindpunt

Chatvoltooiingen

Beschikbaarheid van GPT-4- en GPT-4 Turbo-modellen

Klanttoegang selecteren

GPT-3.5-modellen

Modellen verfijnen

Assistenten (preview)

Buitengebruikstelling van model

Volgende stappen

Feedback

Aanvullende resources