Azure OpenAI Service-Modelle

Artikel
10/28/2024

Azure OpenAI Service basiert auf einer Vielzahl von Modellen mit unterschiedlichen Funktionen und Preispunkten. Die Modellverfügbarkeit variiert je nach Region und Cloud. Informationen zur Verfügbarkeit des Azure Government-Modells finden Sie unter Azure Government OpenAI Service.

Modelle	Beschreibung
o1-Preview und o1-Mini	Modelle mit eingeschränktem Zugriff, die speziell für die Behandlung von Erläuterungen und Problemlösungsaufgaben mit erhöhtem Fokus und mehr Funktionalität konzipiert wurden.
GPT-4o und GPT-4o mini und GPT-4 Turbo	Die neuesten und leistungsstärksten Azure OpenAI-Modelle mit multimodalen Versionen, die sowohl Text als auch Bilder als Eingabe akzeptieren.
GPT-4o-Realtime-Preview	Ein GPT-4o-Modell, das Unterhaltungsinteraktionen mit Sprachein- und -ausgabe mit geringer Latenz unterstützt.
GPT-4	Eine Reihe von Modellen, die GPT-3.5 verbessern und natürliche Sprache sowie Code verstehen und generieren können.
GPT-3.5	Eine Reihe von Modellen, die GPT-3 verbessern und natürliche Sprache sowie Code verstehen und generieren können.
Einbettungen	Eine Reihe von Modellen, die Text in numerische Vektorform konvertieren können, um die Textähnlichkeit zu erleichtern.
DALL-E	Eine Reihe von Modellen, die Originalbilder aus natürlicher Sprache generieren können.
Whisper	Eine Reihe von Modellen in der Vorschau, die Sprache transkribieren und in Text übersetzen können.
Sprachsynthese (Vorschau)	Eine Reihe von Modellen in der Vorschau, die Text in Sprache synthetisieren können.

Eingeschränkter Zugriff auf o1-preview- und o1-mini-Modelle

Die Azure OpenAI-Modelle o1-preview und o1-mini sind speziell für die Behandlung von Erläuterungen und Problemlösungsaufgaben mit erhöhtem Fokus und mehr Funktionalität konzipiert. Diese Modelle verbringen mehr Zeit damit, die Anforderung eines Benutzers zu verarbeiten und zu verstehen, sodass sie im Vergleich zu früheren Iterationen außergewöhnlich stark in Bereichen wie Wissenschaft, Codierung und Mathematik sind.

Modell-ID	Beschreibung	Maximale Anforderung (Token)	Trainingsdaten (bis)
`o1-preview` (2024-09-12)	Das fähigste Modell in der o1-Serie, das erweiterte Fähigkeiten für logisches Denken bietet.	Eingabe: 128.000 Ausgabe: 32.768	Oktober 2023
`o1-mini` (2024-09-12)	Eine schnellere und kostengünstigere Option in der o1-Serie, ideal für das Programmieren von Vorgängen, die höhere Geschwindigkeit und geringeren Ressourcenverbrauch erfordern.	Eingabe: 128.000 Ausgabe: 65.536	Oktober 2023

Verfügbarkeit

Das o1-preview- und o1-mini-Modell sind jetzt für API-Zugriff und Modellimplementierung verfügbar. Es ist eine Registrierung erforderlich, und der Zugriff wird basierend auf den Berechtigungskriterien von Microsoft gewährt.

Anfordern des Zugriffs: Modellanwendung mit eingeschränktem Zugriff

Nachdem der Zugriff gewährt wurde, müssen Sie eine Bereitstellung für jedes Modell erstellen.

API-Unterstützung

Unterstützung für die Modelle der o1-Serie wurde in der API-Version 2024-09-01-previewhinzugefügt.

Der max_tokens-Parameter ist veraltet und wurde durch den neuen max_completion_tokens-Parameter ersetzt. Modelle der o1-Serie funktionieren nur mit dem max_completion_tokens-Parameter.

Verbrauch

Diese Modelle unterstützen derzeit nicht denselben Satz von Parametern wie andere Modelle, welche die Chatabschluss-API verwenden. Derzeit wird nur eine sehr begrenzte Teilmenge unterstützt, sodass allgemeine Parameter wie temperature, top_p nicht verfügbar sind und dies dazu führt, dass Ihre Anforderung fehlschlägt. o1-preview- und o1-mini-Modelle akzeptieren auch die Systemmeldungsrolle nicht als Teil des Nachrichtenarrays.

Möglicherweise müssen Sie Ihre Version der OpenAI Python-Bibliothek aktualisieren, um den neuen max_completion_tokens-Parameter zu nutzen.

pip install openai --upgrade

Wenn Sie mit der Verwendung von Microsoft Entra ID für die Authentifizierung noch nicht vertraut sind, lesen Sie Konfigurieren von Azure OpenAI Service mit Microsoft Entra ID-Authentifizierung.

from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  azure_ad_token_provider=token_provider,
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

Möglicherweise müssen Sie Ihre Version der OpenAI Python-Bibliothek aktualisieren, um den neuen max_completion_tokens-Parameter zu nutzen.

pip install openai --upgrade


from openai import AzureOpenAI

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  api_key=os.getenv("AZURE_OPENAI_API_KEY"),  
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

{
  "id": "chatcmpl-AEj7pKFoiTqDPHuxOcirA9KIvf3yz",
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "logprobs": null,
      "message": {
        "content": "Writing your first Python API is an exciting step in developing software that can communicate with other applications. An API (Application Programming Interface) allows different software systems to interact with each other, enabling data exchange and functionality sharing. Here are the steps you should consider when creating your first Python API:\n\n1. **Define the Purpose and Requirements**\n\n   - **Identify the Functionality**: Clearly outline what your API is supposed to do. What data or services will it provide to the users?\n   - **Determine the Endpoints**: Plan the different URLs (endpoints) through which users can access the API functionalities.\n   - **Specify Request and Response Formats**: Decide on the data formats (usually JSON) for incoming requests and outgoing responses.\n\n2. **Choose the Right Framework**\n\n   Python offers several frameworks for building APIs. Two of the most popular are:\n\n   - **Flask**: A lightweight and flexible web framework, great for small to medium-sized APIs.\n   - **FastAPI**: A modern, high-performance framework for building APIs with Python 3.6+ types, offering automatic interactive documentation.\n\n   **Example**:\n   ```bash\n   pip install flask\n   ```\n   or\n   ```bash\n   pip install fastapi uvicorn\n   ```\n\n3. **Set Up the Development Environment**\n\n   - **Create a Virtual Environment**: Isolate your project dependencies using `venv` or `conda`.\n   - **Install Required Packages**: Ensure all necessary libraries and packages are installed.\n\n   **Example**:\n   ```bash\n   python -m venv env\n   source env/bin/activate  # On Windows use `env\\Scripts\\activate`\n   ```\n\n4. **Implement the API Endpoints**\n\n   - **Write the Code for Each Endpoint**: Implement the logic that handles requests and returns responses.\n   - **Use Decorators to Define Routes**: In frameworks like Flask, you use decorators to specify the URL endpoints.\n\n   **Example with Flask**:\n   ```python\n   from flask import Flask, request, jsonify\n\n   app = Flask(__name__)\n\n   @app.route('/hello', methods=['GET'])\n   def hello_world():\n       return jsonify({'message': 'Hello, World!'})\n\n   if __name__ == '__main__':\n       app.run(debug=True)\n   ```\n\n5. **Handle Data Serialization and Deserialization**\n\n   - **Parsing Incoming Data**: Use libraries to parse JSON or other data formats from requests.\n   - **Formatting Output Data**: Ensure that responses are properly formatted in JSON or XML.\n\n6. **Implement Error Handling**\n\n   - **Handle Exceptions Gracefully**: Provide meaningful error messages and HTTP status codes.\n   - **Validate Input Data**: Check for required fields and appropriate data types to prevent errors.\n\n   **Example**:\n   ```python\n   @app.errorhandler(404)\n   def resource_not_found(e):\n       return jsonify(error=str(e)), 404\n   ```\n\n7. **Add Authentication and Authorization (If Necessary)**\n\n   - **Secure Endpoints**: If your API requires, implement security measures such as API keys, tokens (JWT), or OAuth.\n   - **Manage User Sessions**: Handle user login states and permissions appropriately.\n\n8. **Document Your API**\n\n   - **Use Tools Like Swagger/OpenAPI**: Automatically generate interactive API documentation.\n   - **Provide Usage Examples**: Help users understand how to interact with your API.\n\n   **Example with FastAPI**:\n   FastAPI automatically generates docs at `/docs` using Swagger UI.\n\n9. **Test Your API**\n\n   - **Write Unit and Integration Tests**: Ensure each endpoint works as expected.\n   - **Use Testing Tools**: Utilize tools like `unittest`, `pytest`, or API testing platforms like Postman.\n\n   **Example**:\n   ```python\n   import unittest\n   class TestAPI(unittest.TestCase):\n       def test_hello_world(self):\n           response = app.test_client().get('/hello')\n           self.assertEqual(response.status_code, 200)\n   ```\n\n10. **Optimize Performance**\n\n    - **Improve Response Times**: Optimize your code and consider using asynchronous programming if necessary.\n    - **Manage Resource Utilization**: Ensure your API can handle the expected load.\n\n11. **Deploy Your API**\n\n    - **Choose a Hosting Platform**: Options include AWS, Heroku, DigitalOcean, etc.\n    - **Configure the Server**: Set up the environment to run your API in a production setting.\n    - **Use a Production Server**: Instead of the development server, use WSGI servers like Gunicorn or Uvicorn.\n\n    **Example**:\n    ```bash\n    uvicorn main:app --host 0.0.0.0 --port 80\n    ```\n\n12. **Monitor and Maintain**\n\n    - **Logging**: Implement logging to track events and errors.\n    - **Monitoring**: Use monitoring tools to track performance and uptime.\n    - **Update and Patch**: Keep dependencies up to date and patch any security vulnerabilities.\n\n13. **Consider Versioning**\n\n    - **Plan for Updates**: Use versioning in your API endpoints to manage changes without breaking existing clients.\n    - **Example**:\n      ```python\n      @app.route('/v1/hello', methods=['GET'])\n      ```\n\n14. **Gather Feedback and Iterate**\n\n    - **User Feedback**: Encourage users to provide feedback on your API.\n    - **Continuous Improvement**: Use the feedback to make improvements and add features.\n\n**Additional Tips**:\n\n- **Keep It Simple**: Start with a minimal viable API and expand functionality over time.\n- **Follow RESTful Principles**: Design your API according to REST standards to make it intuitive and standard-compliant.\n- **Security Best Practices**: Always sanitize inputs and protect against common vulnerabilities like SQL injection and cross-site scripting (XSS).\nBy following these steps, you'll be well on your way to creating a functional and robust Python API. Good luck with your development!",
        "refusal": null,
        "role": "assistant",
        "function_call": null,
        "tool_calls": null
      },
      "content_filter_results": {
        "hate": {
          "filtered": false,
          "severity": "safe"
        },
        "protected_material_code": {
          "filtered": false,
          "detected": false
        },
        "protected_material_text": {
          "filtered": false,
          "detected": false
        },
        "self_harm": {
          "filtered": false,
          "severity": "safe"
        },
        "sexual": {
          "filtered": false,
          "severity": "safe"
        },
        "violence": {
          "filtered": false,
          "severity": "safe"
        }
      }
    }
  ],
  "created": 1728073417,
  "model": "o1-preview-2024-09-12",
  "object": "chat.completion",
  "service_tier": null,
  "system_fingerprint": "fp_503a95a7d8",
  "usage": {
    "completion_tokens": 1843,
    "prompt_tokens": 20,
    "total_tokens": 1863,
    "completion_tokens_details": {
      "audio_tokens": null,
      "reasoning_tokens": 448
    },
    "prompt_tokens_details": {
      "audio_tokens": null,
      "cached_tokens": 0
    }
  },
  "prompt_filter_results": [
    {
      "prompt_index": 0,
      "content_filter_results": {
        "custom_blocklists": {
          "filtered": false
        },
        "hate": {
          "filtered": false,
          "severity": "safe"
        },
        "jailbreak": {
          "filtered": false,
          "detected": false
        },
        "self_harm": {
          "filtered": false,
          "severity": "safe"
        },
        "sexual": {
          "filtered": false,
          "severity": "safe"
        },
        "violence": {
          "filtered": false,
          "severity": "safe"
        }
      }
    }
  ]
}

Regionale Verfügbarkeit

Verfügbar für Standard- und globale Standardbereitstellungen in USA, Osten, USA, Osten2, USA, Norden-Mitte, USA, Süden-Mitte, Schweden, Mitte, USA, Westen und USA, Westen3 für berechtigte Kundenkonten.

GPT-4o-Realtime-Preview

Das gpt-4o-realtime-preview-Modell ist Teil der GPT-4o-Modellfamilie und unterstützt Unterhaltungsinteraktionen mit Sprachein- und -ausgabe mit geringer Latenz. GPT-4o-Audio wurde entwickelt, um Unterhaltungsinteraktionen mit geringer Latenz in Echtzeit zu verarbeiten, sodass es für Supportmitarbeiter, Assistenten, Übersetzer und andere Anwendungsfälle, die eine hohe Interaktivität mit dem Benutzer haben, geeignet ist.

GPT-4o-Audio ist in den Regionen East US 2 (eastus2) und Schweden, Mitte (swedencentral) verfügbar. Um GPT-4o-Audio zu verwenden, müssen Sie eine vorhandene Ressource in einer der unterstützten Regionen erstellen oder verwenden.

Wenn Ihre Ressource erstellt ist, können Sie das GPT-4o-Audiomodell bereitstellen. Wenn Sie eine programmgesteuerte Bereitstellung durchführen, ist der Modellname gpt-4o-realtime-preview. Weitere Informationen zur Verwendung von GPT-4o-Audio finden Sie in der GPT-4o-Audiodokumentation.

Details zu maximalen Anforderungstoken und Trainingsdaten sind in der folgenden Tabelle verfügbar.

Modell-ID	Beschreibung	Maximale Anforderung (Token)	Trainingsdaten (bis)
`gpt-4o-realtime-preview` (2024-10-01-Preview) GPT-4o-Audio	Audiomodell für die Echtzeitaudioverarbeitung	Eingabe: 128.000 Ausgabe: 4.096	Oktober 2023

GPT-4o und GPT-4 Turbo

GPT-4o integriert Text und Bilder in einem einzelnen Modell, sodass mehrere Datentypen gleichzeitig verarbeitet werden können. Dieser multimodale Ansatz verbessert die Genauigkeit und Reaktionsfähigkeit bei Interaktionen zwischen Mensch und Computer. GPT-4o entspricht GPT-4 Turbo bei Text- und Codierungsaufgaben in englischer Sprache und bietet eine überlegene Leistung in anderen Sprachen und Visionsaufgaben, wobei neue Benchmarks für KI-Funktionen erreicht werden.

Wie greife ich auf die Modelle „GPT-4o2“ und „GPT-4o mini“ zu?

GPT-4o und GPT-4o mini sind für die Modellimplementierung vom Typ standard und global-standard verfügbar.

Sie müssen eine Ressource in einer unterstützten Standard- oder globalen Standardregion, in der das Modell verfügbar ist, erstellen oder eine dort vorhandene Ressource verwenden.

Wenn Ihre Ressource erstellt wird, können Sie die GPT-4o-Modelle bereitstellen. Wenn Sie eine programmgesteuerte Bereitstellung durchführen, lauten die Modellnamen wie folgt:

gpt-4o Version 2024-08-06
gpt-4o, Version 2024-05-13
gpt-4o-mini Version 2024-07-18

GPT-4 Turbo

GPT-4 Turbo ist ein großes multimodales Modell, das Text- oder Bildeingaben akzeptiert und Text generiert sowie schwierige Probleme mit höherer Genauigkeit als alle früheren Modelle von OpenAI lösen kann. Wie GPT-3.5 Turbo und ältere GPT-4-Modelle ist GPT-4 Turbo für Chats optimiert und eignet sich gut für gängige Vervollständigungsaufgaben.

Das neueste GA-Release (Allgemeine Verfügbarkeit) von GPT-4 Turbo ist:

gpt-4 Version: turbo-2024-04-09

Es ersetzt die folgenden Vorschaumodelle:

gpt-4 Version: 1106-Preview
gpt-4 Version: 0125-Preview
gpt-4 Version: vision-preview

Unterschiede zwischen den allgemein verfügbaren Modellen OpenAI und Azure OpenAI GPT-4 Turbo

Die Version des neuesten 0409 Turbo-Modells von OpenAI unterstützt den JSON-Modus und Funktionsaufrufe für alle Rückschlussanforderungen.
Die neueste turbo-2024-04-09 Version von Azure OpenAI unterstützt derzeit nicht die Verwendung des JSON-Modus und keine Funktionsaufrufe beim Durchführen von Rückschlussanforderungen mit Bildeingaben (Vision). Textbasierte Eingabeanforderungen (Anforderungen ohne image_url und Inlinebilder) unterstützen den JSON-Modus und Funktionsaufrufe.

Unterschiede zu gpt-4 vision-preview

Die Integration von Azure KI-spezifischen Vision-Erweiterungen mit GPT-4 Turbo mit Vision wird nicht unterstützt für gpt-4 Version: turbo-2024-04-09. Dazu gehören optische Zeichenerkennung (Optical Character Recognition, OCR), Objektgrounding, Videoprompts und eine verbesserte Verarbeitung Ihrer Daten mit Bildern.

Wichtig

Previewfunktionen für Vision-Verbesserungen, einschließlich optischer Zeichenerkennung (Optical Character Recognition, OCR), Objekterdung und Videoeingabeaufforderungen werden eingestellt werden und nicht mehr verfügbar sein, sobald für die gpt-4-Version vision-preview ein Upgrade auf turbo-2024-04-09 durchgeführt wird. Wenn Sie sich derzeit auf eine dieser Previewfunktionen verlassen, wird dieses automatische Modellupgrade ein Breaking Change sein.

GPT-4 Turbo bereitgestellte verwaltete Verfügbarkeit

gpt-4 Version: turbo-2024-04-09 ist sowohl für Standard- als auch für bereitgestellte Implementierungen verfügbar. Derzeit unterstützt die bereitgestellte Version dieses Modells keine Bild-/Vision-Anforderungen für Rückschlüsse. Bereitgestellte Implementierungen dieses Modells akzeptieren nur Texteingaben. Standardmodellimplementierungen akzeptieren sowohl Text- als auch Bild-/Vision-Anforderungen für Rückschlüsse.

Bereitstellen von GPT-4 Turbo mit Vision GA

Um das GA-Modell über die Studio-Benutzeroberfläche bereitzustellen, wählen Sie GPT-4 und dann die Version turbo-2024-04-09 im Dropdownmenü aus. Das Standardkontingent für das gpt-4-turbo-2024-04-09-Modell entspricht dem aktuellen Kontingent für GPT-4-Turbo. Weitere Informationen finden Sie in den regionalen Kontingentbeschränkungen.

GPT-4

GPT-4 ist der Vorgänger von GPT-4 Turbo. Sowohl für GPT-4- als auch für GPT-4 Turbo-Modelle lautet der Basismodellname gpt-4. Sie können die Modellversion verwenden, um zwischen GPT-4- und Turbo-Modellen zu unterscheiden.

gpt-4 Version 0314
gpt-4 Version 0613
gpt-4-32k Version 0613

Sie können die Tokenkontextlänge, die von jedem Modell unterstützt wird, in der Modellzusammenfassungstabelle sehen.

GPT-4- und GPT-4 Turbo-Modelle

Diese Modelle können nur mit der Chatvervollständigungs-API verwendet werden.

In Modellversionen erfahren Sie, wie Azure OpenAI Service Modellversionsupgrades verarbeitet, und Arbeiten mit Modellen, um zu erfahren, wie Sie die Modellversionseinstellungen Ihrer GPT-4-Bereitstellungen anzeigen und konfigurieren.

Modell-ID	Beschreibung	Maximale Anforderung (Token)	Trainingsdaten (bis)
`gpt-4o` (2024-08-06) GPT-4o (Omni)	Neues allgemein verfügbares großes Modell - Strukturierte Ausgaben – Text, Bildverarbeitung - JSON-Modus - Paralleler Funktionsaufruf – Höhere Genauigkeit und Reaktionsfähigkeit – Parity mit englischen Text- und Codierungsaufgaben im Vergleich zu GPT-4 Turbo mit Vision – Überlegene Leistung in nicht englischen Sprachen und in Visionsaufgaben	Eingabe: 128.000 Ausgabe: 16.384	Oktober 2023
`gpt-4o-mini` (2024-07-18) GPT-4o mini	Neuestes allgemein verfügbares kleines Modell - Schnelles, kostengünstiges, leistungsfähiges Modell ideal zum Ersetzen von Modellen der GPT-3.5 Turbo-Serie – Text, Bildverarbeitung - JSON-Modus - Paralleler Funktionsaufruf	Eingabe: 128.000 Ausgabe: 16.384	Oktober 2023
`gpt-4o` (2024-05-13) GPT-4o (Omni)	Text, Bildverarbeitung - JSON-Modus - Paralleler Funktionsaufruf – Höhere Genauigkeit und Reaktionsfähigkeit – Parity mit englischen Text- und Codierungsaufgaben im Vergleich zu GPT-4 Turbo mit Vision – Überlegene Leistung in nicht englischen Sprachen und in Visionsaufgaben	Eingabe: 128.000 Ausgabe: 4.096	Oktober 2023
`gpt-4` (turbo-2024-04-09) GPT-4 Turbo mit Vision	Neues GA-Modell – Ersatz für alle vorherigen GPT-4-Vorschaumodelle (`vision-preview`, `1106-Preview`, `0125-Preview`) - Die Verfügbarkeit von Features unterscheidet sich derzeit je nach Eingabemethode und Bereitstellungstyp.	Eingabe: 128.000 Ausgabe: 4.096	Dez. 2023
`gpt-4` (0125-Preview)* GPT-4 Turbo-Preview	Vorschaumodell -Ersetzt 1106-Preview - Bessere Leistung bei der Codegenerierung - Reduziert Fälle, in denen das Modell keine Aufgabe abgeschlossen hat - JSON-Modus - Paralleler Funktionsaufruf - reproduzierbare Ausgabe (Vorschau)	Eingabe: 128.000 Ausgabe: 4.096	Dez. 2023
`gpt-4` (vision-preview) GPT-4 Turbo mit Vision-Vorschau	Vorschaumodell - Akzeptiert Text- und Bildeingaben. - Unterstützt Verbesserungen - JSON-Modus - Paralleler Funktionsaufruf - reproduzierbare Ausgabe (Vorschau)	Eingabe: 128.000 Ausgabe: 4.096	Apr 2023
`gpt-4` (1106-Vorschau) GPT-4 Turbo-Preview	Vorschaumodell - JSON-Modus - Paralleler Funktionsaufruf - reproduzierbare Ausgabe (Vorschau)	Eingabe: 128.000 Ausgabe: 4.096	Apr 2023
`gpt-4-32k` (0613)	Älteres GA-Modell - Grundlegende Funktionsaufrufe mit Tools	32,768	September 2021
`gpt-4` (0613)	Älteres GA-Modell - Grundlegende Funktionsaufrufe mit Tools	8\.192	September 2021
`gpt-4-32k`(0314)	Älteres GA-Modell - Informationen zur Ausmusterung	32,768	September 2021
`gpt-4` (0314)	Älteres GA-Modell - Informationen zur Ausmusterung	8\.192	September 2021

Achtung

Es wird nicht empfohlen, Vorschaumodelle in der Produktion zu verwenden. Wir werden alle Bereitstellungen von Vorschaumodellen entweder auf zukünftige Vorschauversionen oder auf die neueste stabile/GA-Version aktualisieren. Modelle, die als Vorschau bezeichnet wurden, entsprechen nicht dem standardmäßigen Azure OpenAI-Modelllebenszyklus.

GPT-4 Version 0125-preview ist eine aktualisierte Version der GPT-4 Turbo Preview, die zuvor als Version 1106-preview veröffentlicht wurde.
GPT-4 Version 0125-preview erledigt Aufgaben wie die Codegenerierung vollständiger als die Version gpt-4-1106-preview. Je nach Aufgabe stellen Kund*innen möglicherweise fest, dass GPT-4-0125-preview im Vergleich zur gpt-4-1106-preview mehr Ausgaben generiert. Wir empfehlen Kund*innen, die Ausgaben des neuen Modells zu vergleichen. GPT-4-0125-preview behebt auch Fehler von gpt-4-1106-preview mit UTF-8-Behandlung für nicht englische Sprachen.
GPT-4 Version turbo-2024-04-09 ist das neueste GA-Release und ersetzt 0125-Preview, 1106-preview und vision-preview.

Wichtig

Die GPT-4 (gpt-4)-Versionen 1106-Preview, 0125-Preview und vision-preview werden in Zukunft mit einer stabilen Version von gpt-4 aktualisiert.

Bereitstellungen der gpt-4-Versionen 1106-Preview, 0125-Preview und vision-preview werden auf „Automatisches Update auf Standard“ festgelegt, und „Upgrade nach Ablauf“ wird gestartet, nachdem die stabile Version veröffentlicht wurde. Für jede Bereitstellung erfolgt ein Upgrade der Modellversion ohne Unterbrechung des Diensts für API-Aufrufe. Upgrades werden nach Region gestaffelt, und der gesamte Upgradevorgang wird voraussichtlich 2 Wochen dauern.
Bereitstellungen der gpt-4-Versionen 1106-Preview, 0125-Preview und vision-preview, die auf „Kein Autoupgrade“ festgelegt sind, werden nicht aktualisiert und werden nicht mehr ausgeführt, wenn die Vorschauversion in der Region aktualisiert wird. Weitere Informationen zum Zeitpunkt des Upgrades finden Sie unter Eingestellte und veraltete Azure OpenAI-Modelle.

GPT-3.5

GPT-3.5-Modelle können natürliche Sprache oder Code verstehen und generieren. Das leistungsfähigste und kostengünstigste Modell in der GPT-3.5-Familie ist GPT-3.5 Turbo, das für den Chat optimiert wurde und auch für herkömmliche Vervollständigungsaufgaben gut geeignet ist. GPT-3.5 Turbo ist für die Verwendung mit der Chatvervollständigungs-API verfügbar. GPT-3.5 Turbo Instruct verfügt über ähnliche Funktionen wie text-davinci-003 und nutzt die Vervollständigungs-API anstelle der Chatvervollständigungs-API. Es wird empfohlen, GPT-3.5 Turbo und GPT-3.5 Turbo Instruct anstatt der älteren GPT-3.5- und GPT-3.5-Modelle zu verwenden.

Modell-ID	Beschreibung	Maximale Anforderung (Token)	Trainingsdaten (bis)
`gpt-35-turbo` (0125) NEU	Neuestes GA-Modell - JSON-Modus - Paralleler Funktionsaufruf - reproduzierbare Ausgabe (Vorschau) - Höhere Genauigkeit bei der Reaktion in angeforderten Formaten. - Behebung eines Fehlers, der zu einem Textcodierungsproblem bei Nicht-Englisch-Funktionsaufrufen führte.	Eingabe: 16.385 Ausgabe: 4.096	September 2021
`gpt-35-turbo` (1106)	Älteres GA-Modell - JSON-Modus - Paralleler Funktionsaufruf - reproduzierbare Ausgabe (Vorschau)	Eingabe: 16.385 Ausgabe: 4.096	September 2021
`gpt-35-turbo-instruct` (0914)	Nur Endpunkt für Abschlüsse – Ersatz für Legacy-Vervollständigungsmodelle	4.097	September 2021
`gpt-35-turbo-16k` (0613)	Älteres GA-Modell - Grundlegende Funktionsaufrufe mit Tools	16.384	September 2021
`gpt-35-turbo` (0613)	Älteres GA-Modell - Grundlegende Funktionsaufrufe mit Tools	4\.096	September 2021
`gpt-35-turbo`¹ (0301)	Älteres GA-Modell - Informationen zur Ausmusterung	4\.096	September 2021

Weitere Informationen zu GPT-3.5 Turbo und zur Chatvervollständigungs-API finden Sie in unserer ausführlichen Anleitung.

¹ Dieses Modell akzeptiert Anforderungen von mehr als 4.096 Token. Es wird nicht empfohlen, den Grenzwert von 4.096 Eingabetoken zu überschreiten, da die neuere Version des Modells auf 4.096 Token begrenzt ist. Wenn bei diesem Modell 4.096 Eingabetoken überschritten werden und Probleme auftreten, ist zu beachten, dass diese Konfiguration nicht offiziell unterstützt wird.

Einbettungen

text-embedding-3-large ist das neueste und leistungsfähigste Einbettungsmodell. Das Upgrade zwischen Einbettungsmodellen ist nicht möglich. Um von text-embedding-ada-002 zu text-embedding-3-large zu wechseln, müssen Sie neue Einbettungen generieren.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

In Tests berichtet OpenAI, dass sowohl das große als auch das kleine Einbettungsmodell der dritten Generation eine bessere durchschnittliche Leistung beim Abruf mehrerer Sprachen mit der MIRACL-Benchmark bietet, während die Leistung für englische Aufgaben mit der MTEB-Benchmark aufrechterhalten bleibt.

Bewertungsbenchmark	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
MIRACL-Durchschnitt	31,4	44,0	54.9
MTEB-Durchschnitt	61.0	62,3	64,6

Die Einbettungsmodelle der dritten Generation unterstützen die Reduzierung der Einbettungsgröße über einen neuen dimensions-Parameter. In der Regel sind größere Einbettungen aus Compute-, Arbeitsspeicher- und Speicherperspektive teurer. Die Möglichkeit, die Anzahl der Dimensionen anzupassen, ermöglicht eine bessere Kontrolle über die Gesamtkosten und die Leistung. Der Parameter dimensions wird nicht in allen Versionen der OpenAI 1.x-Python-Bibliothek unterstützt. Um diesen Parameter zu nutzen, empfehlen wir ein Upgrade auf die neueste Version: pip install openai --upgrade.

Bei den MTEB-Benchmarktests von OpenAI wurde festgestellt, dass die Leistung des Modells der dritten Generation auch dann noch geringfügig besser ist, wenn die Dimensionen auf weniger als 1.536 Dimensionen für text-embeddings-ada-002 reduziert werden.

DALL-E

Die DALL-E-Modelle generieren Bilder aus Textprompts, die der Benutzer bereitstellt. DALL-E 3 ist allgemein verfügbar für die Verwendung mit den REST-APIs. DALL-E 2 und DALL-E 3 mit Client-SDKs befinden sich in der Vorschau.

Whisper

Die Whisper-Modelle können für Spracherkennung verwendet werden.

Sie können das Whisper-Modell auch über die API Batch-Transkription von Azure AI Speech verwenden. Im Artikel Was ist das Whisper-Modell? erfahren Sie mehr darüber, wann Azure KI Speech bzw. wann Azure OpenAI Service verwendet werden sollte.

Sprachsynthese (Vorschau)

Der OpenAI-Sprachsynthesemodelle, die sich derzeit in der Vorschau befinden, können verwendet werden, um Text in Sprache zu synthetisieren.

Sie können den OpenAI-Stimmen für die Sprachsynthese über Azure KI Speech verwenden. Weitere Informationen finden Sie im Leitfaden OpenAI-Stimmen für die Sprachsynthese über Azure OpenAI Service oder über Azure KI Speech.

Tabelle mit Modellzusammenfassung und Regionsverfügbarkeit

Modelle nach Bereitstellungstyp

Azure OpenAI bietet Kunden Auswahlmöglichkeiten bei der Hostingstruktur, die ihren Geschäfts- und Nutzungsmustern entspricht. Der Dienst bietet zwei Haupttypen der Bereitstellung:

Standard wird mit einer globalen Bereitstellungsoption angeboten und leitet den Datenverkehr global weiter, um einen höheren Durchsatz zu bieten.
Bereitgestellt wird ebenfalls mit einer globalen Bereitstellungsoption angeboten, sodass Kunden bereitgestellte Durchsatzeinheiten in der globalen Azure-Infrastruktur erwerben und bereitstellen können.

Alle Bereitstellungen können dieselben Rückschlussvorgänge ausführen, Abrechnung, Skalierung und Leistung unterscheiden sich jedoch erheblich. Weitere Informationen zu Azure OpenAI-Bereitstellungstypen finden Sie in unserer Anleitung zu Bereitstellungstypen.

Verfügbarkeit des globalen Standardmodells

Region	o1-Preview, 2024-09-12	o1-Mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4o-Realtime-Preview, 2024-10-01	gpt-4, turbo-2024-04-09
australiaeast	-	-	✅	-	✅	-	✅
brazilsouth	-	-	✅	-	✅	-	✅
canadaeast	-	-	✅	-	✅	-	✅
eastus	✅	✅	✅	✅	✅	-	✅
eastus2	✅	✅	✅	✅	✅	✅	✅
francecentral	-	-	✅	-	✅	-	✅
germanywestcentral	-	-	✅	-	✅	-	✅
japaneast	-	-	✅	-	✅	-	✅
koreacentral	-	-	✅	-	✅	-	✅
northcentralus	✅	✅	✅	✅	✅	-	✅
norwayeast	-	-	✅	-	✅	-	✅
polandcentral	-	-	✅	-	✅	-	✅
southafricanorth	-	-	✅	-	✅	-	✅
southcentralus	✅	✅	✅	✅	✅	-	✅
southindia	-	-	✅	-	✅	-	✅
spaincentral	-	-	✅	✅	✅	-	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	-	-	✅	-	✅	-	✅
uaenorth	-	-	✅	-	✅	-	✅
uksouth	-	-	✅	-	✅	-	✅
westeurope	-	-	✅	-	✅	-	✅
westus	✅	✅	✅	✅	✅	-	✅
westus3	✅	✅	✅	✅	✅	-	✅

Verfügbarkeit von global bereitgestellten verwalteten Modellen

Region	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18
australiaeast	✅	✅
brazilsouth	✅	✅
canadacentral	✅	✅
canadaeast	✅	✅
eastus	✅	✅
eastus2	✅	✅
francecentral	✅	✅
germanywestcentral	✅	✅
japaneast	✅	✅
koreacentral	✅	✅
northcentralus	✅	✅
norwayeast	✅	✅
polandcentral	✅	✅
southafricanorth	✅	✅
southcentralus	✅	✅
southindia	✅	✅
spaincentral	✅	✅
swedencentral	✅	✅
switzerlandnorth	✅	✅
switzerlandwest	✅	✅
uksouth	✅	✅
westeurope	✅	✅
westus	✅	✅
westus3	✅	✅

Verfügbarkeit des globalen Batchmodells

Region	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, turbo-2024-04-09	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125
australiaeast	✅	✅	✅	✅	✅	✅	✅	✅
canadaeast	✅	✅	✅	✅	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	✅	✅	✅	✅	✅
japaneast	✅	✅	✅	✅	✅	✅	✅	✅
koreacentral	✅	✅	✅	✅	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅
norwayeast	✅	✅	✅	✅	✅	✅	✅	✅
southcentralus	✅	✅	✅	✅	✅	✅	✅	✅
southindia	✅	✅	✅	✅	✅	✅	✅	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	✅	✅	✅	✅	✅	✅	✅	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅
westeurope	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	✅	✅	✅	✅	✅

Verfügbarkeit des Standardmodells der Datenzone

Region	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18
eastus	✅	✅	✅
eastus2	✅	✅	✅
francecentral	✅	✅	✅
germanywestcentral	✅	✅	✅
northcentralus	✅	✅	✅
polandcentral	✅	✅	✅
southcentralus	✅	✅	✅
spaincentral	✅	✅	✅
swedencentral	✅	✅	✅
westeurope	✅	✅	✅
westus	✅	✅	✅
westus3	✅	✅	✅

Verfügbarkeit des Standardbereitstellungsmodells

Region	o1-Preview, 2024-09-12	o1-Mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, vision-preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0301	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613	gpt-35-turbo-instruct, 0914	text-embedding-3-small, 1	text-embedding-3-large, 1	text-embedding-ada-002, 1	text-embedding-ada-002, 2	dall-e-2, 2.0	dall-e-3, 3.0	babbage-002, 1	davinci-002, 1	tts, 001	tts-hd, 001	whisper, 001
australiaeast	-	-	-	-	-	✅	✅	-	✅	-	✅	-	✅	✅	-	✅	-	-	-	-	✅	-	✅	-	-	-	-	-
brazilsouth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-
canadaeast	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	✅	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	-
eastus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-
eastus2	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	✅
francecentral	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	-	✅	-	-	✅	-	✅	-	-	-	-	-	-	-
japaneast	-	-	-	-	-	-	-	-	✅	-	-	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	-
northcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	✅	-	✅	✅	-	-	-	-	✅	-	-	✅	✅	✅	✅	✅
norwayeast	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-	-	-	✅	-	✅	-	-	-	-	-	-	✅
polandcentral	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-
southafricanorth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-
southcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	-	-	✅	-	-	-	-	✅	✅	-	-	-	-	-	-	-
southindia	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	-	-	-	-	✅	-	✅	-	-	-	-	-	-	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	✅	✅	-	✅	✅	-	✅	-	✅	-	✅	✅	✅	✅	✅	✅
switzerlandnorth	-	-	-	-	-	✅	-	-	✅	-	✅	-	✅	-	-	✅	-	-	✅	-	✅	-	-	-	-	-	-	✅
uaenorth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅
uksouth	-	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	-	-	-	-	-
westeurope	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅
westus	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	-	-	✅	✅	-	-	-	-	-	✅	-	-	-	-	-	-	-
westus3	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	✅	-	-	-	✅	-	✅	-	-	-	-	-	-	-

Verfügbarkeit des bereitgestellten Bereitstellungsmodells

Region	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125
australiaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
brazilsouth	✅	-	✅	✅	✅	✅	-	✅	✅	-
canadacentral	-	-	-	✅	-	-	-	✅	-	✅
canadaeast	✅	-	✅	✅	✅	-	✅	-	✅	-
eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	✅	✅	✅	-	✅	-	✅
germanywestcentral	✅	-	-	✅	✅	✅	✅	✅	✅	-
japaneast	✅	✅	✅	-	✅	✅	✅	-	-	✅
koreacentral	✅	✅	✅	✅	-	-	✅	✅	✅	-
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
norwayeast	✅	-	✅	✅	-	✅	-	✅	-	-
polandcentral	✅	-	-	✅	✅	✅	✅	✅	✅	✅
southafricanorth	✅	-	-	✅	✅	-	✅	✅	✅	-
southcentralus	✅	-	-	✅	✅	✅	✅	✅	✅	✅
southindia	✅	-	✅	✅	✅	✅	-	✅	✅	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandwest	-	-	-	-	-	-	-	-	-	✅
uaenorth	✅	-	-	-	✅	-	-	-	✅	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	-	✅	✅	✅	✅	✅	✅	✅

Hinweis

Die bereitgestellte Version von gpt-4 Version: turbo-2024-04-09 ist derzeit ausschließlich auf Text beschränkt.

Weitere Informationen zu bereitgestellten Bereitstellungen finden Sie in den bereitgestellten Richtlinien.

Diese Tabelle enthält keine Feinabstimmung der regionalen Verfügbarkeitsinformationen. Weitere Informationen finden Sie im Abschnitt Feinabstimmung.

Standardmodelle nach Endpunkt

Chatvervollständigungen

Region	o1-Preview, 2024-09-12	o1-Mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, vision-preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0301	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613
australiaeast	-	-	-	-	-	✅	✅	-	✅	-	✅	-	✅	✅	-	✅
canadaeast	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	✅	-	✅	✅
eastus2	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	✅	-	✅	✅
francecentral	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	-	✅
japaneast	-	-	-	-	-	-	-	-	✅	-	-	-	✅	-	✅	✅
northcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	✅	-	✅	✅
norwayeast	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-
southcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	-	-	✅	-
southindia	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	-	-
swedencentral	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	✅	✅	-	✅
switzerlandnorth	-	-	-	-	-	✅	-	-	✅	-	✅	-	✅	-	-	✅
uksouth	-	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅
westeurope	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-
westus	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	-	-	✅	✅	-
westus3	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	✅	-

GPT-4- und GPT-4 Turbo-Modellverfügbarkeit

Kundenzugriff auswählen

Zusätzlich zu den oben genannten Regionen, die allen Azure OpenAI-Kunden zur Verfügung stehen, wurden einigen ausgewählten bereits bestehenden Kunden in zusätzlichen Regionen Zugriff auf Versionen von GPT-4 gewährt:

Modell	Region
`gpt-4` (0314) `gpt-4-32k` (0314)	East US Frankreich, Mitte USA Süd Mitte UK, Süden
`gpt-4` (0613) `gpt-4-32k` (0613)	East US USA (Ost) 2 Japan, Osten UK, Süden

GPT-3.5-Modelle

Einbettungsmodelle

Region	text-embedding-3-small, 1	text-embedding-3-large, 1	text-embedding-ada-002, 1	text-embedding-ada-002, 2
australiaeast	-	-	-	✅
brazilsouth	-	-	-	✅
canadaeast	✅	✅	-	✅
eastus	✅	✅	✅	✅
eastus2	✅	✅	-	✅
francecentral	-	✅	-	✅
japaneast	✅	✅	-	✅
northcentralus	-	-	-	✅
norwayeast	-	✅	-	✅
polandcentral	-	✅	-	-
southafricanorth	-	-	-	✅
southcentralus	-	-	✅	✅
southindia	-	✅	-	✅
swedencentral	-	✅	-	✅
switzerlandnorth	-	✅	-	✅
uaenorth	-	-	-	✅
uksouth	-	✅	-	✅
westeurope	-	-	-	✅
westus	-	-	-	✅
westus3	-	✅	-	✅

Diese Modelle können mit einbetteten API-Anforderungen verwendet werden.

Hinweis

text-embedding-3-large ist das neueste und leistungsfähigste Einbettungsmodell. Das Upgrade zwischen Einbettungsmodellen ist nicht möglich. Für die Migration von text-embedding-ada-002 zu text-embedding-3-large müssen Sie neue Einbettungen generieren.

Modell-ID	Maximale Anforderung (Token)	Ausgabedimensionen	Trainingsdaten (bis)
`text-embedding-ada-002` (Version 2)	8\.192	1\.536	September 2021
`text-embedding-ada-002` (Version 1)	2.046	1\.536	September 2021
`text-embedding-3-large`	8\.192	3\.072	September 2021
`text-embedding-3-small`	8\.192	1\.536	September 2021

Hinweis

Wenn ein Array von Eingaben für die Einbettung gesendet wird, können pro Aufruf des Einbettungsendpunkts maximal 2.048 Eingabeelemente im Array verwendet werden.

Bildgenerierungsmodelle

Region	dall-e-2, 2.0	dall-e-3, 3.0
australiaeast	-	✅
eastus	✅	✅
swedencentral	-	✅

DALL-E-Modelle

Modell-ID	Max. Anforderung (Zeichen)
dalle2 (Vorschau)	1.000
dall-e-3	4\.000

Audiomodelle

Region	tts, 001	tts-hd, 001	whisper, 001
eastus2	-	-	✅
northcentralus	✅	✅	✅
norwayeast	-	-	✅
southindia	-	-	✅
swedencentral	✅	✅	✅
switzerlandnorth	-	-	✅
uaenorth	-	-	✅
westeurope	-	-	✅

Whisper-Modelle

Modell-ID	Maximale Anforderung (Größe der Audiodatei)
`whisper`	25 MB

Sprachsynthesemodelle (Vorschau)

Modell-ID	Beschreibung
`tts`	Das neueste Sprachsynthesemodell von Azure OpenAI, auf Geschwindigkeit optimiert.
`tts-hd`	Das neueste Sprachsynthesemodell von Azure OpenAI, auf Qualität optimiert.

Vervollständigungsmodelle

babbage-002 und davinci-002 sind nicht trainiert, Anweisungen zu befolgen. Das Abfragen dieser Basismodelle sollte nur als Referenzpunkt für eine fein abgestimmte Version dienen, um den Fortschritt Ihres Trainings zu bewerten.

Region	gpt-35-turbo-instruct, 0914	babbage-002, 1	davinci-002, 1
eastus	✅	-	-
northcentralus	-	✅	✅
swedencentral	✅	✅	✅

Optimierung von Modellen

Hinweis

gpt-35-turbo – Die Feinabstimmung dieses Modells ist auf eine Teilmenge von Regionen beschränkt und ist nicht in allen Regionen, in denen das Basismodell verfügbar ist, verfügbar.

Die unterstützten Regionen für die Feinabstimmung können variieren, wenn Sie Azure OpenAI-Modelle in einem KI Studio-Projekt im Vergleich zu außerhalb eines Projekts verwenden.

Modell-ID	Regionen mit Feinabstimmung	Maximale Anforderung (Token)	Trainingsdaten (bis)
`babbage-002`	USA Nord Mitte Schweden, Mitte Schweiz, Westen	16.384	September 2021
`davinci-002`	USA Nord Mitte Schweden, Mitte Schweiz, Westen	16.384	September 2021
`gpt-35-turbo` (0613)	USA (Ost 2) USA Nord Mitte Schweden, Mitte Schweiz, Westen	4\.096	September 2021
`gpt-35-turbo` (1106)	USA (Ost 2) USA Nord Mitte Schweden, Mitte Schweiz, Westen	Eingabe: 16.385 Ausgabe: 4.096	September 2021
`gpt-35-turbo` (0125)	USA (Ost 2) USA Nord Mitte Schweden, Mitte Schweiz, Westen	16.385	September 2021
`gpt-4` (0613) ¹	USA Nord Mitte Schweden, Mitte	8192	September 2021
`gpt-4o-mini` (2024-07-18)	USA Nord Mitte Schweden, Mitte	Eingabe: 128.000 Ausgabe: 16.384 Kontextlänge im Beispieltraining: 64.536	Oktober 2023
`gpt-4o` (2024-08-06)	USA (Ost 2) USA Nord Mitte Schweden, Mitte	Eingabe: 128.000 Ausgabe: 16.384 Kontextlänge im Beispieltraining: 64.536	Oktober 2023

¹ GPT-4 befindet sich derzeit in der öffentlichen Vorschau.

Assistants (Vorschau)

Für Assistants benötigen Sie eine Kombination aus einem unterstützten Modell und einer unterstützten Region. Für bestimmte Tools und Funktionen sind die neuesten Modelle erforderlich. Die folgenden Modelle sind in der Assistants-API, im SDK und in Azure KI Studio verfügbar. Die folgende Tabelle ist für die nutzungsbasierte Bezahlung. Informationen zur Verfügbarkeit der bereitgestellten Durchsatzeinheit (PTU) finden Sie unter bereitgestellten Durchsatz. Die aufgeführten Modelle und Regionen können sowohl mit v1 als auch v2 des Assistenten verwendet werden. Sie können globalen Standardmodelle verwenden, wenn sie in den unten aufgeführten Regionen unterstützt werden.

Region	`gpt-35-turbo (0613)`	`gpt-35-turbo (1106)`	`fine tuned gpt-3.5-turbo-0125`	`gpt-4 (0613)`	`gpt-4 (1106)`	`gpt-4 (0125)`	`gpt-4o (2024-05-13)`	`gpt-4o-mini (2024-07-18)`
Australien (Osten)	✅	✅		✅	✅
East US	✅					✅	✅	✅
USA (Ost) 2	✅		✅	✅	✅		✅
Frankreich, Mitte	✅	✅		✅	✅
Japan, Osten	✅
Norwegen, Osten					✅
Schweden, Mitte	✅	✅	✅	✅	✅		✅
UK, Süden	✅	✅			✅	✅
USA (Westen)		✅			✅		✅
USA, Westen 3					✅		✅

Modelldeaktivierung

Die neuesten Informationen zur Modelldeaktivierung finden Sie im Leitfaden zur Modelldeaktivierung.

Freigeben über

Azure OpenAI Service-Modelle

Eingeschränkter Zugriff auf o1-preview- und o1-mini-Modelle

Verfügbarkeit

API-Unterstützung

Verbrauch

Regionale Verfügbarkeit

GPT-4o-Realtime-Preview

GPT-4o und GPT-4 Turbo

Wie greife ich auf die Modelle „GPT-4o2“ und „GPT-4o mini“ zu?

GPT-4 Turbo

Unterschiede zwischen den allgemein verfügbaren Modellen OpenAI und Azure OpenAI GPT-4 Turbo

Unterschiede zu gpt-4 vision-preview

GPT-4 Turbo bereitgestellte verwaltete Verfügbarkeit

Bereitstellen von GPT-4 Turbo mit Vision GA

GPT-4

GPT-4- und GPT-4 Turbo-Modelle

GPT-3.5

Einbettungen

DALL-E

Whisper

Sprachsynthese (Vorschau)

Tabelle mit Modellzusammenfassung und Regionsverfügbarkeit

Modelle nach Bereitstellungstyp

Verfügbarkeit des globalen Standardmodells

Standardmodelle nach Endpunkt

Chatvervollständigungen

GPT-4- und GPT-4 Turbo-Modellverfügbarkeit

Kundenzugriff auswählen

GPT-3.5-Modelle

Optimierung von Modellen

Assistants (Vorschau)

Modelldeaktivierung

Nächste Schritte

Feedback

Zusätzliche Ressourcen