Referenz zur Vorschauversion der REST-API von Azure OpenAI Service
Dieser Artikel enthält Details zu den REST API-Rückschlussendpunkten für Azure OpenAI.
API-Spezifikationen
Die Verwaltung von Azure OpenAI-Modellen und -Ressourcen und die Interaktion mit ihnen ist auf drei primäre API-Oberflächen aufgeteilt:
- Steuerungsebene
- Datenebene: Erstellung
- Datenebene: Rückschluss
Jede API-Oberfläche/-Spezifikation kapselt eine andere Gruppe von Azure OpenAI-Funktionen. Jede API verfügt über individuelle Vorschau-API-Releases und stabile/allgemein verfügbare API-Releases. Vorschaureleases folgen derzeit in der Regel einem monatlichen Rhythmus.
API | Neuestes Vorschaurelease | Neuestes allgemein verfügbares Release | Spezifikationen | Beschreibung |
---|---|---|---|---|
Steuerungsebene | 2024-06-01-preview |
2024-10-01 |
Spezifikationsdateien | Azure OpenAI teilt sich eine gemeinsame Steuerungsebene mit allen anderen Azure KI Services-Instanzen. Die Steuerungsebenen-API wird unter anderem zum Erstellen von Azure OpenAI-Ressourcen, für die Modellimplementierung und für andere übergeordnete Ressourcenverwaltungsaufgaben verwendet. Die Steuerungsebene steuert auch, was mit Komponenten wie Azure Resource Manager, Bicep, Terraform und der Azure CLI möglich ist. |
Datenebene: Erstellung | 2024-10-01-preview |
2024-10-21 |
Spezifikationsdateien | Die Erstellungs-API der Datenebene steuert die Optimierung, Dateiuploads, Datenerfassungsaufträge, Batchvorgänge und bestimmte Abfragen auf Modellebene. |
Datenebene: Rückschluss | 2024-12-01-preview |
2024-10-21 |
Spezifikationsdateien | Die Datenebenen-API für Rückschlüsse stellt die Rückschlussfunktionen/-endpunkte für Features wie Vervollständigungen, Chatvervollständigungen, Einbettungen, Speech/Whisper, „On Your Data“, DALL-E, Assistenten usw. bereit. |
Authentifizierung
Azure OpenAI bietet zwei Authentifizierungsmethoden. Sie können entweder API-Schlüssel oder Microsoft Entra-ID verwenden.
API-Schlüssel-Authentifizierung: Bei dieser Art der Authentifizierung müssen alle API-Anforderungen den API-Schlüssel in den
api-key
-HTTP-Header einbeziehen. Die Schnellstartanleitung bietet eine Anleitung, wie Sie mit dieser Art der Authentifizierung Aufrufe tätigen können.Microsoft Entra ID-Authentifizierung: Sie können einen API-Aufruf mit einem Microsoft Entra-Token authentifizieren. Authentifizierungstoken werden als
Authorization
-Header in eine Anforderung eingefügt. Dem bereitgestellten Token mussBearer
vorangestellt werden. Beispiel:Bearer YOUR_AUTH_TOKEN
. Sie können unsere Anleitung zur Authentifizierung mit Microsoft Entra ID lesen.
REST-API-Versionsverwaltung
Die Dienst-APIs erhalten mithilfe des Abfrageparameters api-version
ihre Versionsangaben. Alle Versionen folgen der Datumsstruktur JJJJ-MM-TT. Zum Beispiel:
POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01
Datenebene: Rückschluss
Der Rest des Artikels behandelt das neueste Vorschaurelease der Azure OpenAI-Datenebenenspezifikation für Rückschlüsse: 2024-10-01-preview
. In diesem Artikel werden die neuesten Vorschaufunktionen wie Assistenten, Threads und Vektorspeicher dokumentiert.
Eine Dokumentation für das neueste allgemein verfügbare API-Release der Datenebenen-API für Rückschlüsse finden Sie hier.
Vervollständigungen: Erstellen
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-12-01-preview
Erstellt eine Vervollständigung für den angegebenen Prompt sowie für die angegebenen Parameter und das gewählte Modell.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
Bereitstellungs-ID | path | Ja | Zeichenfolge | Bereitstellungs-ID des -Modells, das bereitgestellt wurde |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
prompt | Zeichenfolge oder Array | Die Prompts zum Generieren von Vervollständigungen, die als Zeichenfolge, Array von Zeichenfolgen, Array von Token oder Array von Tokenarrays codiert werden. Beachten Sie, dass <|endoftext|> das Dokumententrennzeichen ist, das das Modell während des Trainings sieht. Wenn also kein Prompt angegeben wird, wird die Generierung des Modells wie am Anfang eines neuen Dokuments durchgeführt. |
Ja | |
best_of | integer | Generiert serverseitige best_of -Vervollständigungen und gibt die „beste“ zurück (diejenige mit der höchsten logarithmierten Wahrscheinlichkeit pro Token). Die Ergebnisse können nicht gestreamt werden.Wenn Sie diese Funktion zusammen mit n verwenden, steuert best_of die Anzahl der möglichen Vervollständigungen, und n gibt an, wie viele zurückgegeben werden sollen – best_of muss größer als n sein.Hinweis: Da dieser Parameter viele Vervollständigungen generiert, kann Ihr Tokenkontingent schnell aufgebraucht sein. Verwenden Sie ihn sorgfältig und stellen Sie sicher, dass Sie angemessene Einstellungen für max_tokens und stop verwenden. |
No | 1 |
Echo | boolean | Geben Sie die Äußerung zusätzlich zur Vervollständigung zurück. |
No | False |
frequency_penalty | Zahl | Eine Zahl zwischen -2,0 und 2,0. Positive Werte benachteiligen neue Token auf der Grundlage ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit, dass das Modell dieselbe Zeile wortwörtlich wiederholt, sinkt. |
No | 0 |
logit_bias | Objekt | Ändern Sie die Wahrscheinlichkeit, dass bestimmte Token in der Vervollständigung vorkommen. Akzeptiert ein JSON-Objekt, das Token (angegeben durch ihre Token-ID im GPT-Tokenizer) einem zugehörigen Tendenzwert von -100 bis 100 zuordnet. Mathematisch gesehen wird die Verzerrung zu den Logits addiert, die das Modell vor der Stichprobenentnahme generiert. Die genaue Auswirkung ist von Modell zu Modell unterschiedlich, aber Werte zwischen -1 und 1 sollten die Wahrscheinlichkeit der Auswahl verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Verbot oder einer ausschließlichen Auswahl des betreffenden Tokens führen. Sie können beispielsweise {"50256": -100} übergeben, um zu verhindern, dass das Token <|endoftext|> generiert wird. |
No | Keine |
logprobs | integer | Beziehen Sie die logarithmierten Wahrscheinlichkeiten für die wahrscheinlichsten Token von logprobs sowie die ausgewählten Ausgabetoken ein. Wenn logprobs z. B. „5“ ist, gibt die API eine Liste mit den fünf wahrscheinlichsten Tokens zurück. Die API gibt immer logprob des Tokens der Stichprobenentnahme zurück, sodass die Antwort bis zu logprobs+1 Elemente enthalten kann.Der Höchstwert für logprobs ist 5. |
No | Keine |
max_tokens | integer | Die maximale Anzahl von Token, die in der Vervollständigung generiert werden können. Die Tokenanzahl Ihres Prompts plus max_tokens darf die Kontextlänge des Modells nicht überschreiten. |
Nein | 16 |
n | integer | Wie viele Vervollständigungen für jede Äußerung generiert werden sollen. Hinweis: Da dieser Parameter viele Vervollständigungen generiert, kann Ihr Tokenkontingent schnell aufgebraucht sein. Verwenden Sie ihn sorgfältig und stellen Sie sicher, dass Sie angemessene Einstellungen für max_tokens und stop verwenden. |
No | 1 |
presence_penalty | Zahl | Eine Zahl zwischen -2,0 und 2,0. Positive Werte benachteiligen neue Token, je nachdem, ob sie bereits im Text vorkommen, und erhöhen so die Wahrscheinlichkeit, dass das Modell über neue Themen spricht. |
No | 0 |
seed | integer | Wenn Sie dies angeben, bemüht sich unser System nach besten Kräften, eine deterministische Auswahl zu treffen, sodass wiederholte Anforderungen mit demselben seed und denselben Parametern dasselbe Ergebnis liefern sollten.Der Determinismus ist nicht garantiert, und Sie sollten auf den system_fingerprint Antwortparameter verweisen, um Änderungen im Back-End zu überwachen. |
No | |
stop | Zeichenfolge oder Array | Bis zu vier Sequenzen, in denen die API aufhört, weitere Token zu generieren. Der zurückgegebene Text wird die Beendigungssequenz nicht enthalten. |
No | |
Datenstrom | boolean | Gibt an, ob der Teilfortschritt zurückgestreamt werden soll. Wenn dieser Parameter festgelegt wird, werden Token als vom Server gesendete Ereignisse (nur Daten) übermittelt, sobald sie verfügbar sind, wobei der Stream durch die Nachricht data: [DONE] beendet wird. |
No | False |
Suffix | Zeichenfolge | Das Suffix, das nach einer Vervollständigung des eingefügten Texts folgt. Der Parameter wird nur von gpt-3.5-turbo-instruct unterstützt. |
No | Keine |
Temperatur | Zahl | Die zu verwendende Temperatur für die Stichprobenentnahme zwischen 0 und 2. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. Wir empfehlen im Allgemeinen, dies oder top_p zu ändern, aber nicht beides. |
No | 1 |
top_p | Zahl | Eine Alternative zur Stichprobenentnahme mit Temperatur, die sogenannte Kernstichprobenentnahme (Nucleus Sampling), bei dem das Modell die Ergebnisse der Token mit der Wahrscheinlichkeitsmasse „top_p“ berücksichtigt. Daher bedeutet 0,1, dass nur die Token berücksichtigt werden, die die oberen 10 % der Wahrscheinlichkeitsmasse umfassen. Wir empfehlen im Allgemeinen, dies oder temperature zu ändern, aber nicht beides. |
No | 1 |
user | Zeichenfolge | Ein eindeutiger Bezeichner, der Ihr Endbenutzerkonto darstellt und bei der Überwachung und Erkennung von Missbrauch helfen kann. |
No |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | createCompletionResponse | Stellt eine Vervollständigungsantwort der API dar. Hinweis: Sowohl die gestreamten als auch nicht gestreamten Antwortobjekte verwenden dieselbe Form (im Gegensatz zum Chatendpunkt). |
Statuscode: Standard
Beschreibung: Dienst nicht verfügbar
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | errorResponse |
Beispiele
Beispiel
Erstellt eine Vervollständigung für den angegebenen Prompt sowie für die angegebenen Parameter und das gewählte Modell.
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-12-01-preview
{
"prompt": [
"tell me a joke about mango"
],
"max_tokens": 32,
"temperature": 1.0,
"n": 1
}
Antworten: Statuscode: 200
{
"body": {
"id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
"created": 1686617332,
"choices": [
{
"text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
"index": 0,
"finish_reason": "stop",
"logprobs": null
}
],
"usage": {
"completion_tokens": 20,
"prompt_tokens": 6,
"total_tokens": 26
}
}
}
Einbettungen: Erstellen
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-12-01-preview
Rufen Sie eine Vektordarstellung einer bestimmten Eingabe ab, die von Machine Learning-Modellen und anderen Algorithmen problemlos verarbeitet werden kann.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
Bereitstellungs-ID | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
input | Zeichenfolge oder Array | Eingabetext zum Einbetten, codiert als Zeichenfolge oder Array von Token. Übergeben Sie ein Array von Zeichenfolgen oder ein Array von Tokenarrays, um mehrere Eingaben in einer einzelnen Anforderung einzubetten. Die Eingabe darf die maximal zulässigen Eingabetoken für das Modell nicht überschreiten (8.192 Token für text-embedding-ada-002 ), darf keine leere Zeichenfolge sein, und jedes Array muss 2.048 Dimensionen oder weniger umfassen. |
Ja | |
user | Zeichenfolge | Ein eindeutiger Bezeichner, der Ihren Endbenutzer darstellt und bei der Überwachung und Erkennung von Missbrauch helfen kann. | No | |
input_type | Zeichenfolge | Eingabetyp der zu verwendenden Einbettungssuche | No | |
encoding_format | Zeichenfolge | Das Format, in das die Einbettungen zurückgegeben werden sollen. Kann entweder float oder base64 sein. Wird standardmäßig auf float festgelegt. |
No | |
Dimensionen | integer | Die Anzahl der Dimensionen, die die resultierenden Ausgabeeinbettungen aufweisen sollen. Nur in text-embedding-3 und späteren Modellen unterstützt. |
No |
Antworten
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Objekt | Zeichenfolge | Ja | ||
Modell | Zeichenfolge | Ja | ||
data | array | Ja | ||
Nutzung | Objekt | Ja |
Eigenschaften für „usage“
prompt_tokens
Name | Typ | Beschreibung | Standard |
---|---|---|---|
prompt_tokens | integer |
total_tokens
Name | Typ | Beschreibung | Standard |
---|---|---|---|
total_tokens | integer |
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | Objekt |
Beispiele
Beispiel
Zurückgeben der Einbettungen für eine bestimmte Eingabeaufforderung
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-12-01-preview
{
"input": [
"this is a test"
]
}
Antworten: Statuscode: 200
{
"body": {
"data": [
{
"index": 0,
"embedding": [
-0.012838088,
-0.007421397,
-0.017617522,
-0.028278312,
-0.018666342,
0.01737855,
-0.01821495,
-0.006950092,
-0.009937238,
-0.038580645,
0.010674067,
0.02412286,
-0.013647936,
0.013189907,
0.0021125758,
0.012406612,
0.020790534,
0.00074595667,
0.008397198,
-0.00535031,
0.008968075,
0.014351576,
-0.014086051,
0.015055214,
-0.022211088,
-0.025198232,
0.0065186154,
-0.036350243,
0.009180495,
-0.009698266,
0.009446018,
-0.008463579,
-0.0040426035,
-0.03443847,
-0.00091273896,
-0.0019217303,
0.002349888,
-0.021560553,
0.016515596,
-0.015572986,
0.0038666942,
-8.432463e-05
]
}
],
"usage": {
"prompt_tokens": 4,
"total_tokens": 4
}
}
}
Chatvervollständigungen: Erstellen
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-12-01-preview
Erstellt eine Vervollständigung für die Chatnachricht.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
Bereitstellungs-ID | path | Ja | Zeichenfolge | Bereitstellungs-ID des -Modells, das bereitgestellt wurde |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Temperatur | Zahl | Die zu verwendende Temperatur für die Stichprobenentnahme zwischen 0 und 2. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. Wir empfehlen im Allgemeinen, dies oder top_p zu ändern, aber nicht beides. |
No | 1 |
top_p | Zahl | Eine Alternative zur Stichprobenentnahme mit Temperatur, die sogenannte Kernstichprobenentnahme (Nucleus Sampling), bei dem das Modell die Ergebnisse der Token mit der Wahrscheinlichkeitsmasse „top_p“ berücksichtigt. Daher bedeutet 0,1, dass nur die Token berücksichtigt werden, die die oberen 10 % der Wahrscheinlichkeitsmasse umfassen. Wir empfehlen im Allgemeinen, dies oder temperature zu ändern, aber nicht beides. |
No | 1 |
Datenstrom | boolean | Wenn diese Einstellung festgelegt ist, werden teilweise Nachrichtendeltas gesendet, wie in ChatGPT. Token werden als vom Server gesendete Ereignisse (reine Daten) übermittelt, sobald sie verfügbar sind, wobei der Stream durch eine data: [DONE] -Nachricht beendet wird |
No | False |
stop | Zeichenfolge oder Array | Bis zu vier Sequenzen, in denen die API aufhört, weitere Token zu generieren. |
No | |
max_tokens | integer | Die maximale Anzahl von Token, die in der Chatvervollständigung generiert werden können. Die Gesamtlänge der Eingabetoken und generierten Token wird durch die Kontextlänge des Modells begrenzt. |
No | |
max_completion_tokens | integer | Eine obere Grenze für die Anzahl der Tokens, die für eine Vervollständigung generiert werden können, einschließlich sichtbarer Ausgabetokens und Begründungstokens. Dies wird nur bei Modellen der o1-Serie unterstützt. Die Unterstützung wird in einer zukünftigen API-Version auf andere Modelle ausgeweitet. | No | |
presence_penalty | Zahl | Eine Zahl zwischen -2,0 und 2,0. Positive Werte benachteiligen neue Token, je nachdem, ob sie bereits im Text vorkommen, und erhöhen so die Wahrscheinlichkeit, dass das Modell über neue Themen spricht. |
No | 0 |
frequency_penalty | Zahl | Eine Zahl zwischen -2,0 und 2,0. Positive Werte benachteiligen neue Token auf der Grundlage ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit, dass das Modell dieselbe Zeile wortwörtlich wiederholt, sinkt. |
No | 0 |
logit_bias | Objekt | Ändern Sie die Wahrscheinlichkeit, dass bestimmte Token in der Vervollständigung vorkommen. Ein JSON-Objekt, das Token (angegeben durch die Token-ID im Tokenizer) einem zugehörigen Verzerrungswert von –100 bis 100 zuordnet. Mathematisch gesehen wird die Verzerrung zu den Logits addiert, die das Modell vor der Stichprobenentnahme generiert. Die genaue Auswirkung ist von Modell zu Modell unterschiedlich, aber Werte zwischen -1 und 1 sollten die Wahrscheinlichkeit der Auswahl verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Verbot oder einer ausschließlichen Auswahl des betreffenden Tokens führen. |
No | Keine |
store | boolean | Gibt an, ob die Ausgabe dieser Chatvervollständigungsanforderung für die Verwendung in unseren Modelldestillations- oder Evaluierungsprodukten gespeichert werden soll. | No | |
metadata | Objekt | Entwicklerdefinierte Tags und Werte, die zum Filtern von Fertigstellungen im Dashboard für gespeicherte Fertigstellungen verwendet werden. | No | |
user | Zeichenfolge | Ein eindeutiger Bezeichner, der Ihr Endbenutzerkonto darstellt und bei der Überwachung und Erkennung von Missbrauch helfen kann. |
No | |
Cloud an das Gerät | array | Eine Liste der Nachrichten, aus denen die Unterhaltung bisher besteht. | Ja | |
data_sources | array | Die Konfigurationseinträge für Azure OpenAI-Chaterweiterungen, die sie verwenden. Diese zusätzliche Spezifikation ist nur mit Azure OpenAI kompatibel. |
No | |
reasoning_effort | enum | Nur o1-Modelle Schränkt den Begründungsaufwand ein für Begründungsmodelle. Derzeit werden die Werte low , medium und high unterstützt. Das Reduzieren von Begründungen kann zu schnelleren Antworten und weniger Token führen, die bei der Begründung in einer Antwort verwendet werden.Mögliche Werte: Niedrig, Mittel, Hoch |
No | |
logprobs | boolean | Gibt an, ob Protokollwahrscheinlichkeiten der Ausgabetoken zurückgegeben werden sollen. Wenn wahr, gibt die Protokollwahrscheinlichkeiten jedes Ausgabetokens zurück, das in der content von message zurückgegeben wird. |
No | False |
top_logprobs | integer | Eine ganze Zahl zwischen 0 und 20, die die Anzahl der höchstwahrscheinlichen Token an jeder Tokenposition angibt, jeweils mit einer zugeordneten Protokollwahrscheinlichkeit. logprobs muss auf true festgelegt werden, wenn dieser Parameter verwendet wird. |
No | |
n | integer | Wie viele Optionen für die Chatvervollständigung für jede Eingabenachricht generiert werden sollen. Beachten Sie, dass Ihnen die Anzahl der generierten Tokens für alle Auswahlmöglichkeiten in Rechnung gestellt wird. Behalten Sie n als 1 , um die Kosten zu minimieren. |
No | 1 |
parallel_tool_calls | ParallelToolCalls | Gibt an, ob beim Verwenden des Tools parallele Funktionsaufrufe aktiviert werden sollen. | Nein | True |
response_format | ResponseFormatText oder ResponseFormatJsonObject oder ResponseFormatJsonSchema | Ein Objekt, das das Format angibt, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4o mini, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen, die neuer als gpt-3.5-turbo-1106 sind.Die Einstellung auf { "type": "json_schema", "json_schema": {...} } ermöglicht strukturierte Ausgaben, die garantieren, dass das Modell Ihrem bereitgestellten JSON-Schema entspricht.Wenn Sie ihn auf { "type": "json_object" } festlegen, wird der JSON-Modus aktiviert, der sicherstellt, dass die vom Modells generierte Meldung gültiger JSON-Code ist.Wichtig: Wenn Sie den JSON-Modus verwenden, müssen Sie selbst das Modell auch über eine System- oder Benutzernachricht anweisen, JSON-Code zu erzeugen. Andernfalls generiert das Modell möglicherweise einen unendlichen Leerzeichenstrom, bis der Tokengrenzwert erreicht wird. Dies kann zu einer lange ausgeführten und scheinbar „hängenden“ Anforderung führen. Beachten Sie auch, dass der Meldungsinhalt teilweise abgeschnitten werden kann, wenn Sie finish_reason="length" verwenden. Damit wird angegeben, dass bei der Generierung max_tokens überschritten wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat. |
No | |
seed | integer | Dieses Feature befindet sich in der Betaversion. Wenn Sie dies angeben, bemüht sich unser System nach besten Kräften, eine deterministische Auswahl zu treffen, sodass wiederholte Anforderungen mit demselben seed und denselben Parametern dasselbe Ergebnis liefern sollten.Der Determinismus ist nicht garantiert, und Sie sollten auf den system_fingerprint Antwortparameter verweisen, um Änderungen im Back-End zu überwachen. |
No | |
stream_options | chatCompletionStreamOptions | Optionen für eine Streamingantwort. Legen Sie dies nur fest, wenn Sie stream: true festlegen. |
No | Keine |
tools | array | Eine Liste der Tools, die das Modell aufrufen kann. Derzeit werden nur Funktionen als Tool unterstützt. Verwenden Sie diesen Parameter, um eine Liste der Funktionen anzugeben, für die das Modell JSON-Eingaben generieren kann. Es werden maximal 128 Funktionen unterstützt. |
No | |
Toolauswahl | chatCompletionToolChoiceOption | Steuert, welches Tool (falls vorhanden) vom Modell aufgerufen wird. none bedeutet, dass das Modell keine Tools aufruft und stattdessen eine Meldung generiert. auto bedeutet, dass das Modell zwischen dem Generieren einer Meldung und dem Aufrufen von Tools wählen kann. required bedeutet, dass das Modell mindestens ein Tool aufrufen muss. Wenn Sie mit {"type": "function", "function": {"name": "my_function"}} ein bestimmtes Tool angeben, wird das Modell gezwungen, dieses aufzurufen. none ist die Standardeinstellung, wenn keine Tools vorhanden sind. auto ist die Standardeinstellung, wenn Tools vorhanden sind. |
No | |
function_call | string oder chatCompletionFunctionCallOption | Zugunsten von tool_choice eingestellt.Steuert, welche Funktion (falls vorhanden) vom Modell aufgerufen wird. none bedeutet, dass das Modell keine Funktion aufruft und stattdessen eine Nachricht generiert.auto bedeutet, dass das Modell zwischen dem Generieren einer Meldung und dem Aufrufen einer Funktion auswählen kann.Wenn Sie über {"name": "my_function"} eine bestimmte Funktion angeben, wird das Modell gezwungen, diese aufzurufen.none ist die Standardeinstellung, wenn keine Funktionen vorhanden sind. auto ist die Standardeinstellung, wenn Funktionen vorhanden sind. |
No | |
functions | array | Zugunsten von tools eingestellt.Eine Liste der Funktionen, für die das Modell JSON-Eingaben generieren kann. |
No | |
user_security_context | userSecurityContext | Der Benutzersicherheitskontext enthält mehrere Parameter, die die KI-Anwendung selbst beschreiben, und den Endbenutzer, der mit der KI-Anwendung interagiert. Diese Felder helfen Ihren Sicherheitsteams dabei, Sicherheitsvorfälle zu untersuchen und zu mindern, da sie einen umfassenden Ansatz zum Schutz Ihrer KI-Anwendungen bieten. Erfahren Sie mehr über den Schutz von KI-Anwendungen mithilfe von Microsoft Defender for Cloud. | No |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | createChatCompletionResponse oder createChatCompletionStreamResponse |
Statuscode: Standard
Beschreibung: Dienst nicht verfügbar
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | errorResponse |
Beispiele
Beispiel
Erstellt eine Vervollständigung für den angegebenen Prompt sowie für die angegebenen Parameter und das gewählte Modell.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-12-01-preview
{
"messages": [
{
"role": "system",
"content": "you are a helpful assistant that talks like a pirate"
},
{
"role": "user",
"content": "can you tell me how to care for a parrot?"
}
]
}
Antworten: Statuscode: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Beispiel
Erstellt eine Vervollständigung auf der Grundlage von Azure Search-Daten und der systemseitig zugewiesenen verwalteten Identität.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-12-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"index_name": "{index name}",
"authentication": {
"type": "system_assigned_managed_identity"
}
}
}
]
}
Antworten: Statuscode: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Beispiel
Erstellt eine Vervollständigung auf der Grundlage von Azure Search-Bildvektordaten.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-12-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"index_name": "{index name}",
"query_type": "vector",
"fields_mapping": {
"image_vector_fields": [
"image_vector"
]
},
"authentication": {
"type": "api_key",
"key": "{api key}"
}
}
}
]
}
Antworten: Statuscode: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion."
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Beispiel
Erstellt eine Vervollständigung auf der Grundlage von Azure Search-Vektordaten, der vorherigen Assistentennachricht und der systemseitig zugewiesenen verwalteten Identität.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-12-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a cat?"
},
{
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"intent": "cat care"
}
},
{
"role": "user",
"content": "how about dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"authentication": {
"type": "user_assigned_managed_identity",
"managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
},
"index_name": "{index name}",
"query_type": "vector",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"in_scope": true,
"top_n_documents": 5,
"strictness": 3,
"role_information": "You are an AI assistant that helps people find information.",
"fields_mapping": {
"content_fields_separator": "\\n",
"content_fields": [
"content"
],
"filepath_field": "filepath",
"title_field": "title",
"url_field": "url",
"vector_fields": [
"contentvector"
]
}
}
}
]
}
Antworten: Statuscode: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content 2.",
"title": "Citation Title 2",
"filepath": "contoso2.txt",
"url": "https://contoso.blob.windows.net/container/contoso2.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Beispiel
Erstellt eine Vervollständigung für die angegebene Azure Cosmos DB-Instanz
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-12-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_cosmos_db",
"parameters": {
"authentication": {
"type": "connection_string",
"connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
},
"database_name": "vectordb",
"container_name": "azuredocs",
"index_name": "azuredocindex",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"content_fields": [
"content"
],
"vector_fields": [
"contentvector"
]
}
}
}
]
}
Antworten: Statuscode: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Beispiel
Erstellt eine Vervollständigung für die angegebene Mongo DB.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-12-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "mongo_db",
"parameters": {
"authentication": {
"type": "username_and_password",
"username": "<username>",
"password": "<password>"
},
"endpoint": "<endpoint_name>",
"app_name": "<application name>",
"database_name": "sampledb",
"collection_name": "samplecollection",
"index_name": "sampleindex",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"content_fields": [
"content"
],
"vector_fields": [
"contentvector"
]
}
}
}
]
}
Antworten: Statuscode: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Beispiel
Erstellt eine Vervollständigung für die angegebene Elasticsearch-Instanz.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-12-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "elasticsearch",
"parameters": {
"endpoint": "https://your-elasticsearch-endpoint.eastus.azurecontainer.io",
"index_name": "{index name}",
"authentication": {
"type": "key_and_key_id",
"key": "{key}",
"key_id": "{key id}"
}
}
}
]
}
Antworten: Statuscode: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Beispiel
Erstellt eine Vervollständigung für die angegebene Pinecone-Ressource.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-12-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "pinecone",
"parameters": {
"authentication": {
"type": "api_key",
"key": "{api key}"
},
"environment": "{environment name}",
"index_name": "{index name}",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"title_field": "title",
"url_field": "url",
"filepath_field": "filepath",
"content_fields": [
"content"
],
"content_fields_separator": "\n"
}
}
}
]
}
Antworten: Statuscode: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Transkriptionen: Erstellen
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-12-01-preview
Transkribiert Audio in die Eingabesprache.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
Bereitstellungs-ID | path | Ja | Zeichenfolge | Bereitstellungs-ID des Whisper-Modells |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: multipart/form-data
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
datei | Zeichenfolge | Das zu transkribierende Audiodateiobjekt | Ja | |
prompt | Zeichenfolge | Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Die Äußerung sollte mit der Audiosprache übereinstimmen. | No | |
response_format | audioResponseFormat | Definiert das Format der Ausgabe | No | |
Temperatur | Zahl | Die Temperatur für die Stichprobenentnahme, zwischen 0 und 1. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. Wenn dieser Wert auf „0“ festgelegt wird, verwendet das Modell die logarithmierte Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht werden. | No | 0 |
language | Zeichenfolge | Die Sprache der Audioeingabe. Die Bereitstellung der Eingabesprache im ISO-639-1-Format verbessert die Genauigkeit und verkürzt die Wartezeit. | No | |
timestamp_granularities[] | array | Die Zeitstempel-Granularitäten, die für diese Transkription ausgefüllt werden sollen. response_format muss auf verbose_json festgelegt werden, um die Zeitstempel-Granularitäten zu verwenden. Eine oder beide dieser Optionen werden unterstützt: word oder segment . Hinweis: Durch Segmentzeitstempel entsteht keine zusätzliche Wartezeit, aber das Generieren von Wortzeitstempeln führt zu zusätzlicher Wartezeit. |
No | ['segment'] |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | audioResponse oder audioVerboseResponse | |
text/plain | Zeichenfolge | Transkribierter Text im Ausgabeformat (wenn „response_format“ entweder „text“, „vtt“ oder „srt“ war) |
Beispiele
Beispiel
Ruft transkribierten Text und zugehörige Metadaten aus bereitgestellten Sprachaudiodaten ab
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Beispiel
Ruft transkribierten Text und zugehörige Metadaten aus bereitgestellten Sprachaudiodaten ab
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-12-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Antworten: Statuscode: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Übersetzungen: Erstellen
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-12-01-preview
Transkribiert Audioeingaben und übersetzt sie in englischen Text.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
Bereitstellungs-ID | path | Ja | Zeichenfolge | Bereitstellungs-ID des Whisper-Modells, das bereitgestellt wurde |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: multipart/form-data
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
datei | Zeichenfolge | Die zu übersetzende Audiodatei | Ja | |
prompt | Zeichenfolge | Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt muss in englischer Sprache formuliert werden. | No | |
response_format | audioResponseFormat | Definiert das Format der Ausgabe | No | |
Temperatur | Zahl | Die Temperatur für die Stichprobenentnahme, zwischen 0 und 1. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. Wenn dieser Wert auf „0“ festgelegt wird, verwendet das Modell die logarithmierte Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht werden. | No | 0 |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | audioResponse oder audioVerboseResponse | |
text/plain | Zeichenfolge | Transkribierter Text im Ausgabeformat (wenn „response_format“ entweder „text“, „vtt“ oder „srt“ war) |
Beispiele
Beispiel
Ruft transkribierten Text in englischer Sprache und zugehörige Metadaten aus bereitgestellten Sprachaudiodaten ab
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-12-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Antworten: Statuscode: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Beispiel
Ruft transkribierten Text in englischer Sprache und zugehörige Metadaten aus bereitgestellten Sprachaudiodaten ab
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-12-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Antworten: Statuscode: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Sprache: Erstellen
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2024-12-01-preview
Generiert Audio aus dem Eingabetext.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
Bereitstellungs-ID | path | Ja | Zeichenfolge | Bereitstellungs-ID des Text-zu-Sprache-Modells, das bereitgestellt wurde |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: multipart/form-data
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
input | Zeichenfolge | Der Text, für den Audio synthetisiert werden soll. Die maximale Länge beträgt 4.096 Zeichen. | Ja | |
voice | enum | Die Stimme, die für die Sprachsynthese verwendet werden soll. Mögliche Werte: alloy, echo, fable, onyx, nova, shimmer |
Ja | |
response_format | enum | Das Format für die Audiosynthetisierung. Mögliche Werte: mp3, opus, aac, flac, wav, pcm |
No | |
Geschwindigkeit | Zahl | Die Geschwindigkeit des synthetisierten Audios. Wählen Sie einen Wert von 0.25 bis 4.0 aus. 1.0 ist die Standardoption. |
No | 1.0 |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/octet-stream | Zeichenfolge |
Beispiele
Beispiel
Synthetisiert Audio aus dem bereitgestellten Text.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2024-12-01-preview
{
"input": "Hi! What are you going to make?",
"voice": "fable",
"response_format": "mp3"
}
Antworten: Statuscode: 200
{
"body": "101010101"
}
Bildgenerierungen: Erstellen
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-12-01-preview
Generiert eine Reihe von Bildern auf der Grundlage einer Textbeschriftung für eine bestimmte DALL-E-Modellimplementierung
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
Bereitstellungs-ID | path | Ja | Zeichenfolge | Bereitstellungs-ID des dall-e-Modells, das bereitgestellt wurde. |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
prompt | Zeichenfolge | Eine Textbeschreibung der gewünschten Bilder. Die maximale Länge beträgt 4.000 Zeichen. | Ja | |
n | integer | Die Anzahl der zu generierenden Bilder. | No | 1 |
size | imageSize | Die Größe der generierten Bilder. | No | 1\.024 × 1.024 |
response_format | imagesResponseFormat | Das Format, in dem die generierten Bilder zurückgegeben werden. | No | url |
user | Zeichenfolge | Ein eindeutiger Bezeichner, der Ihr Endbenutzerkonto darstellt und bei der Überwachung und Erkennung von Missbrauch helfen kann. | No | |
qualität | imageQuality | Die Qualität des zu generierenden Bilds | No | Standard |
style | imageStyle | Die Größe der generierten Bilder. | No | vivid |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | generateImagesResponse |
Statuscode: Standard
Beschreibung: Fehler.
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | dalleErrorResponse |
Beispiele
Beispiel
Erstellt Bilder auf der Grundlage eines Prompts.
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-12-01-preview
{
"prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
"n": 1,
"style": "natural",
"quality": "standard"
}
Antworten: Statuscode: 200
{
"body": {
"created": 1698342300,
"data": [
{
"revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
"prompt_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
},
"profanity": {
"detected": false,
"filtered": false
},
"custom_blocklists": {
"filtered": false,
"details": []
}
},
"url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
"content_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
}
}
}
]
}
}
Auflisten: Assistenten
GET https://{endpoint}/openai/assistants?api-version=2024-12-01-preview
Gibt eine Liste mit Assistenten zurück.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
limit | query | No | integer | |
Reihenfolge | query | No | Zeichenfolge | |
after | query | No | Zeichenfolge | |
before | query | No | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | listAssistantsResponse |
Beispiele
Beispiel
Gibt eine Liste mit Assistenten zurück.
GET https://{endpoint}/openai/assistants?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"object": "list",
"data": [
{
"id": "asst_abc123",
"object": "assistant",
"created_at": 1707257477,
"name": "Stock Analyst",
"description": null,
"model": "gpt-4-1106-preview",
"instructions": "You are a financial analyst that analyzes stock market prices and other financial data present on user uploaded files or by calling external APIs.",
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
},
{
"id": "asst_abc456",
"object": "assistant",
"created_at": 1698982718,
"name": "My Assistant",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are a helpful assistant designed to make me better at coding!",
"tools": [],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
},
{
"id": "asst_abc789",
"object": "assistant",
"created_at": 1698982643,
"name": null,
"description": null,
"model": "gpt-4-turbo",
"instructions": null,
"tools": [],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
],
"first_id": "asst_abc123",
"last_id": "asst_abc789",
"has_more": false
}
}
Erstellen: Assistent
POST https://{endpoint}/openai/assistants?api-version=2024-12-01-preview
Erstellen Sie einen Assistenten mit einem Modell und Anweisungen.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
model | Yes | |||
Name | Zeichenfolge | Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen. |
No | |
Beschreibung | string | Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen. |
No | |
Setup | Zeichenfolge | Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 256,000 Zeichen. |
No | |
tools | array | Eine Liste der im Assistenten aktivierten Tools. Jeder Assistent kann maximal 128 Tools enthalten. Tools können vom Typ code_interpreter , retrieval oder function sein. |
No | [] |
tool_resources | Objekt | Eine Reihe von Ressourcen, die von den Tools des Assistenten verwendet werden. Die Ressourcen sind spezifisch für den Tooltyp. Beispielsweise erfordert das Tool code_interpreter eine Liste mit Datei-IDs, während das Tool file_search eine Liste mit Vektorspeicher-IDs erfordert. |
No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No | |
Temperatur | Zahl | Die zu verwendende Temperatur für die Stichprobenentnahme zwischen 0 und 2. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. |
No | 1 |
top_p | Zahl | Eine Alternative zur Stichprobenentnahme mit Temperatur, die sogenannte Kernstichprobenentnahme (Nucleus Sampling), bei dem das Modell die Ergebnisse der Token mit der Wahrscheinlichkeitsmasse „top_p“ berücksichtigt. Daher bedeutet 0,1, dass nur die Token berücksichtigt werden, die die oberen 10 % der Wahrscheinlichkeitsmasse umfassen. Wir empfehlen im Allgemeinen, dies oder die Temperatur zu ändern, aber nicht beides. |
No | 1 |
response_format | assistantsApiResponseFormatOption | Gibt das Format an, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106 .Das Festlegen auf { "type": "json_schema", "json_schema": {...} } stellt strukturierte Ausgaben, die garantieren, dass das Modell Ihrem bereitgestellten JSON-Schema entspricht, sicher. Weitere Informationen finden Sie in der Anleitung „Strukturierte Ausgaben“.Das Festlegen auf { "type": "json_object" } aktiviert den JSON-Modus, der sicherstellt, dass die vom Modells generierte Meldung gültiger JSON-Code ist.Wichtig: Wenn Sie den JSON-Modus verwenden, müssen Sie selbst das Modell auch über eine System- oder Benutzernachricht anweisen, JSON-Code zu erzeugen. Andernfalls generiert das Modell möglicherweise einen unendlichen Leerzeichenstrom, bis der Tokengrenzwert erreicht wird. Dies kann zu einer lange ausgeführten und scheinbar „hängenden“ Anforderung führen. Beachten Sie auch, dass der Meldungsinhalt teilweise abgeschnitten werden kann, wenn Sie finish_reason="length" verwenden. Damit wird angegeben, dass bei der Generierung max_tokens überschritten wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat. |
No |
Eigenschaften für „tool_resources“
code_interpreter
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_ids | array | Eine Liste mit Datei-IDs, die für das Tool code_interpreter zur Verfügung gestellt wurden. Dem Tool können maximal 20 Dateien zugeordnet sein. |
[] |
file_search
Name | Typ | Beschreibung | Standard |
---|---|---|---|
vector_store_ids | array | Der an diesen Assistenten angefügte Vektorspeicher. An den Assistenten kann maximal ein Vektorspeicher angefügt werden. |
|
vector_stores | array | Ein Hilfsprogramm, das dazu dient, einen Vektorspeicher mit Datei-IDs (file_ids) zu erstellen und an diesen Assistenten anzufügen. An den Assistenten kann maximal ein Vektorspeicher angefügt werden. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | assistantObject | Stellt einen Assistenten (assistant ) dar, der das Modell aufrufen und Tools verwenden kann. |
Beispiele
Beispiel
Erstellen Sie einen Assistenten mit einem Modell und Anweisungen.
POST https://{endpoint}/openai/assistants?api-version=2024-12-01-preview
{
"name": "Math Tutor",
"instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
"tools": [
{
"type": "code_interpreter"
}
],
"model": "gpt-4-1106-preview"
}
Antworten: Statuscode: 200
{
"body": {
"id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
"object": "assistant",
"created_at": 1707295707,
"name": "Math Tutor",
"description": null,
"model": "gpt-4-1106-preview",
"instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
"tools": [
{
"type": "code_interpreter"
}
],
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
Abrufen: Assistent
GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2024-12-01-preview
Ruft einen Assistenten ab.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
assistant_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | assistantObject | Stellt einen Assistenten (assistant ) dar, der das Modell aufrufen und Tools verwenden kann. |
Beispiele
Beispiel
Ruft einen Assistenten ab.
GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "asst_abc123",
"object": "assistant",
"created_at": 1699009709,
"name": "HR Helper",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies.",
"tools": [
{
"type": "file_search"
}
],
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
Ändern: Assistent
POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2024-12-01-preview
Ändert einen Assistenten.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
assistant_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
model | No | |||
name | Zeichenfolge | Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen. |
No | |
Beschreibung | string | Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen. |
No | |
Setup | Zeichenfolge | Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 32.768 Zeichen. |
No | |
tools | array | Eine Liste der im Assistenten aktivierten Tools. Jeder Assistent kann maximal 128 Tools enthalten. Tools können vom Typ code_interpreter , retrieval oder function sein. |
No | [] |
tool_resources | Objekt | Eine Reihe von Ressourcen, die von den Tools des Assistenten verwendet werden. Die Ressourcen sind spezifisch für den Tooltyp. Beispielsweise erfordert das Tool code_interpreter eine Liste mit Datei-IDs, während das Tool file_search eine Liste mit Vektorspeicher-IDs erfordert. |
No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No | |
Temperatur | Zahl | Die zu verwendende Temperatur für die Stichprobenentnahme zwischen 0 und 2. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. |
No | 1 |
top_p | Zahl | Eine Alternative zur Stichprobenentnahme mit Temperatur, die sogenannte Kernstichprobenentnahme (Nucleus Sampling), bei dem das Modell die Ergebnisse der Token mit der Wahrscheinlichkeitsmasse „top_p“ berücksichtigt. Daher bedeutet 0,1, dass nur die Token berücksichtigt werden, die die oberen 10 % der Wahrscheinlichkeitsmasse umfassen. Wir empfehlen im Allgemeinen, dies oder die Temperatur zu ändern, aber nicht beides. |
No | 1 |
response_format | assistantsApiResponseFormatOption | Gibt das Format an, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106 .Das Festlegen auf { "type": "json_schema", "json_schema": {...} } stellt strukturierte Ausgaben, die garantieren, dass das Modell Ihrem bereitgestellten JSON-Schema entspricht, sicher. Weitere Informationen finden Sie in der Anleitung „Strukturierte Ausgaben“.Das Festlegen auf { "type": "json_object" } aktiviert den JSON-Modus, der sicherstellt, dass die vom Modells generierte Meldung gültiger JSON-Code ist.Wichtig: Wenn Sie den JSON-Modus verwenden, müssen Sie selbst das Modell auch über eine System- oder Benutzernachricht anweisen, JSON-Code zu erzeugen. Andernfalls generiert das Modell möglicherweise einen unendlichen Leerzeichenstrom, bis der Tokengrenzwert erreicht wird. Dies kann zu einer lange ausgeführten und scheinbar „hängenden“ Anforderung führen. Beachten Sie auch, dass der Meldungsinhalt teilweise abgeschnitten werden kann, wenn Sie finish_reason="length" verwenden. Damit wird angegeben, dass bei der Generierung max_tokens überschritten wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat. |
No |
Eigenschaften für „tool_resources“
code_interpreter
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_ids | array | Überschreibt die Liste mit den Datei-IDs, die für das Tool code_interpreter zur Verfügung gestellt wurden. Dem Tool können maximal 20 Dateien zugeordnet sein. |
[] |
file_search
Name | Typ | Beschreibung | Standard |
---|---|---|---|
vector_store_ids | array | Überschreibt den an diesen Assistenten angefügten Vektorspeicher. An den Assistenten kann maximal ein Vektorspeicher angefügt werden. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | assistantObject | Stellt einen Assistenten (assistant ) dar, der das Modell aufrufen und Tools verwenden kann. |
Beispiele
Beispiel
Ändert einen Assistenten.
POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2024-12-01-preview
{
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
"tools": [
{
"type": "file_search"
}
],
"model": "gpt-4-turbo"
}
Antworten: Statuscode: 200
{
"body": {
"id": "asst_123",
"object": "assistant",
"created_at": 1699009709,
"name": "HR Helper",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
"tools": [
{
"type": "file_search"
}
],
"tool_resources": {
"file_search": {
"vector_store_ids": []
}
},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
Löschen: Assistent
DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2024-12-01-preview
Löscht einen Assistenten.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
assistant_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | deleteAssistantResponse |
Beispiele
Beispiel
Löscht einen Assistenten.
DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
"object": "assistant.deleted",
"deleted": true
}
}
Erstellen: Thread
POST https://{endpoint}/openai/threads?api-version=2024-12-01-preview
Erstellen Sie einen Thread.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Cloud an das Gerät | array | Eine Liste der Nachrichten, mit der der Thread gestartet werden soll. | No | |
tool_resources | Objekt | Eine Reihe von Ressourcen, die für die Tools des Assistenten in diesem Thread verfügbar gemacht werden. Die Ressourcen sind spezifisch für den Tooltyp. Beispielsweise erfordert das Tool code_interpreter eine Liste mit Datei-IDs, während das Tool file_search eine Liste mit Vektorspeicher-IDs erfordert. |
No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No |
Eigenschaften für „tool_resources“
code_interpreter
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_ids | array | Eine Liste mit Datei-IDs, die für das Tool code_interpreter zur Verfügung gestellt wurden. Dem Tool können maximal 20 Dateien zugeordnet sein. |
[] |
file_search
Name | Typ | Beschreibung | Standard |
---|---|---|---|
vector_store_ids | array | Der an diesen Thread angefügte Vektorspeicher. An den Thread kann maximal ein Vektorspeicher angefügt werden. |
|
vector_stores | array | Ein Hilfsprogramm, das dazu dient, einen Vektorspeicher mit Datei-IDs (file_ids) zu erstellen und an diesen Thread anzufügen. An den Thread kann maximal ein Vektorspeicher angefügt werden. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | threadObject | Stellt einen Thread dar, der Nachrichten enthält. |
Beispiele
Beispiel
Erstellt einen Thread.
POST https://{endpoint}/openai/threads?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {}
}
}
Abrufen: Thread
GET https://{endpoint}/openai/threads/{thread_id}?api-version=2024-12-01-preview
Ruft einen Thread ab.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | threadObject | Stellt einen Thread dar, der Nachrichten enthält. |
Beispiele
Beispiel
Ruft einen Thread ab.
GET https://{endpoint}/openai/threads/{thread_id}?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {},
"tool_resources": {
"code_interpreter": {
"file_ids": []
}
}
}
}
Ändern: Thread
POST https://{endpoint}/openai/threads/{thread_id}?api-version=2024-12-01-preview
Ändert einen Thread.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
tool_resources | Objekt | Eine Reihe von Ressourcen, die für die Tools des Assistenten in diesem Thread verfügbar gemacht werden. Die Ressourcen sind spezifisch für den Tooltyp. Beispielsweise erfordert das Tool code_interpreter eine Liste mit Datei-IDs, während das Tool file_search eine Liste mit Vektorspeicher-IDs erfordert. |
No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No |
Eigenschaften für „tool_resources“
code_interpreter
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_ids | array | Eine Liste mit Datei-IDs, die für das Tool code_interpreter zur Verfügung gestellt wurden. Dem Tool können maximal 20 Dateien zugeordnet sein. |
[] |
file_search
Name | Typ | Beschreibung | Standard |
---|---|---|---|
vector_store_ids | array | Der an diesen Thread angefügte Vektorspeicher. An den Thread kann maximal ein Vektorspeicher angefügt werden. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | threadObject | Stellt einen Thread dar, der Nachrichten enthält. |
Beispiele
Beispiel
Ändert einen Thread.
POST https://{endpoint}/openai/threads/{thread_id}?api-version=2024-12-01-preview
{
"metadata": {
"modified": "true",
"user": "abc123"
}
}
Antworten: Statuscode: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {
"modified": "true",
"user": "abc123"
},
"tool_resources": {}
}
}
Löschen: Thread
DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2024-12-01-preview
Löscht einen Thread.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | deleteThreadResponse |
Beispiele
Beispiel
Löscht einen Thread.
DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread.deleted",
"deleted": true
}
}
Auflisten: Nachrichten
GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2024-12-01-preview
Gibt eine Liste von Nachrichten für einen bestimmten Thread zurück.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
limit | query | No | integer | |
Reihenfolge | query | No | Zeichenfolge | |
after | query | No | Zeichenfolge | |
before | query | No | Zeichenfolge | |
run_id | query | No | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | listMessagesResponse |
Beispiele
Beispiel
List Messages
GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"object": "list",
"data": [
{
"id": "msg_abc123",
"object": "thread.message",
"created_at": 1699016383,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "How does AI work? Explain it in simple terms.",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
},
{
"id": "msg_abc456",
"object": "thread.message",
"created_at": 1699016383,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "Hello, what is AI?",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
}
],
"first_id": "msg_abc123",
"last_id": "msg_abc456",
"has_more": false
}
}
Erstellen: Nachricht
POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2024-12-01-preview
Erstellen Sie eine Nachricht.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
role | Zeichenfolge | Die Rolle der Entität, die die Nachricht erstellt. Zulässige Werte sind: - user : Gibt an, dass die Nachricht von einem realen Benutzer gesendet wird, und sollte in den meisten Fällen verwendet werden, um benutzerseitig generierte Nachrichten darzustellen.- assistant : Gibt an, dass die Nachricht vom Assistenten generiert wird. Verwenden Sie diesen Wert, um Nachrichten aus dem Assistenten in die Unterhaltung einzufügen. |
Ja | |
content | Zeichenfolge | Der Inhalt der Nachricht. | Ja | |
Anhänge | array | Eine Liste mit Dateien, die an die Nachricht angefügt sind, und den Tools, denen sie hinzugefügt werden sollen. | No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | messageObject | Stellt eine Nachricht in einem Thread dar. |
Beispiele
Beispiel
Erstellen Sie eine Nachricht.
POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2024-12-01-preview
{
"role": "user",
"content": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces."
}
Antworten: Statuscode: 200
{
"body": {
"id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
"object": "thread.message",
"created_at": 1707298421,
"assistant_id": null,
"thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
}
}
Abrufen: Nachricht
GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2024-12-01-preview
Rufen Sie eine Nachricht ab.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
message_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | messageObject | Stellt eine Nachricht in einem Thread dar. |
Beispiele
Beispiel
Rufen Sie eine Nachricht ab.
GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
"object": "thread.message",
"created_at": 1707298421,
"thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
"annotations": []
}
}
],
"file_ids": [],
"assistant_id": null,
"run_id": null,
"metadata": {}
}
}
Ändern: Nachricht
POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2024-12-01-preview
Ändert eine Nachricht.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
message_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | messageObject | Stellt eine Nachricht in einem Thread dar. |
Beispiele
Beispiel
Ändern Sie eine Nachricht.
POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2024-12-01-preview
{
"metadata": {
"modified": "true",
"user": "abc123"
}
}
Antworten: Statuscode: 200
{
"body": {
"id": "msg_abc123",
"object": "thread.message",
"created_at": 1699017614,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "How does AI work? Explain it in simple terms.",
"annotations": []
}
}
],
"file_ids": [],
"metadata": {
"modified": "true",
"user": "abc123"
}
}
}
Erstellen: Thread und Ausführung
POST https://{endpoint}/openai/threads/runs?api-version=2024-12-01-preview
Dient dazu, einen Thread in einer einzelnen Anforderung zu erstellen und auszuführen.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
assistant_id | Zeichenfolge | Die ID des Assistenten, der für diese Ausführung verwendet werden soll | Ja | |
Thread | createThreadRequest | No | ||
model | Zeichenfolge | Die ID des Modells, das für diese Ausführung verwendet werden soll. Wenn hier ein Wert angegeben wird, überschreibt dieser das Modell, das dem Assistenten zugeordnet ist. Andernfalls wird das dem Assistenten zugeordnete Modell verwendet. | No | |
Setup | Zeichenfolge | Überschreibt die Standardsystemmeldung des Assistenten. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. | No | |
tools | array | Überschreibt die Tools, die der Assistent für diese Ausführung verwenden kann. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. | No | |
tool_resources | Objekt | Eine Reihe von Ressourcen, die von den Tools des Assistenten verwendet werden. Die Ressourcen sind spezifisch für den Tooltyp. Beispielsweise erfordert das Tool code_interpreter eine Liste mit Datei-IDs, während das Tool file_search eine Liste mit Vektorspeicher-IDs erfordert. |
No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No | |
Temperatur | Zahl | Die zu verwendende Temperatur für die Stichprobenentnahme zwischen 0 und 2. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. |
No | 1 |
top_p | Zahl | Eine Alternative zur Stichprobenentnahme mit Temperatur, die sogenannte Kernstichprobenentnahme (Nucleus Sampling), bei dem das Modell die Ergebnisse der Token mit der Wahrscheinlichkeitsmasse „top_p“ berücksichtigt. Daher bedeutet 0,1, dass nur die Token berücksichtigt werden, die die oberen 10 % der Wahrscheinlichkeitsmasse umfassen. Wir empfehlen im Allgemeinen, dies oder die Temperatur zu ändern, aber nicht beides. |
No | 1 |
Datenstrom | boolean | Bei Verwendung von true wird ein Datenstrom von Ereignissen, die während der Ausführung auftreten, als vom Server gesendete Ereignisse zurückgegeben. Der Datenstrom wird beendet, wenn die Ausführung einen Endzustand mit einer Nachricht vom Typ data: [DONE] erreicht. |
No | |
stream_options | chatCompletionStreamOptions | Optionen für eine Streamingantwort. Legen Sie dies nur fest, wenn Sie stream: true festlegen. |
No | Keine |
max_prompt_tokens | integer | Die maximale Anzahl von Prompttokens, die im Laufe der Ausführung verwendet werden können. Bei der Ausführung wird bestmöglich versucht, über mehrere Durchläufe der Ausführung hinweg nur die angegebene Anzahl von Prompttoken zu verwenden. Wenn die Ausführung die angegebene Anzahl von Prompttoken überschreitet, endet die Ausführung mit dem Status incomplete . Weitere Informationen finden Sie unter incomplete_details . |
No | |
max_completion_tokens | integer | Die maximale Anzahl von Vervollständigungstokens, die im Laufe der Ausführung verwendet werden können. Bei der Ausführung wird bestmöglich versucht, über mehrere Durchläufe der Ausführung hinweg nur die angegebene Anzahl von Vervollständigungstoken zu verwenden. Wenn die Ausführung die angegebene Anzahl von Vervollständigungstoken überschreitet, endet die Ausführung mit dem Status incomplete . Weitere Informationen finden Sie unter incomplete_details . |
No | |
truncation_strategy | truncationObject | Steuert, wie ein Thread vor der Ausführung abgeschnitten wird. Verwenden Sie diese Option, um das anfängliche Kontextfenster der Ausführung zu steuern. | No | |
Toolauswahl | assistantsApiToolChoiceOption | Steuert, welches Tool (falls vorhanden) vom Modell aufgerufen wird.none bedeutet, dass das Modell kein Tool aufruft und stattdessen eine Meldung generiert.auto ist der Standardwert und bedeutet, dass das Modell zwischen dem Generieren einer Meldung und dem Aufrufen einer Funktion auswählen kann.Wenn Sie ein bestimmtes Tool wie {"type": "file_search"} oder {"type": "function", "function": {"name": "my_function"}} angeben, wird das Modell gezwungen, dieses aufzurufen. |
No | |
parallel_tool_calls | ParallelToolCalls | Gibt an, ob beim Verwenden des Tools parallele Funktionsaufrufe aktiviert werden sollen. | Nein | True |
response_format | assistantsApiResponseFormatOption | Gibt das Format an, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106 .Das Festlegen auf { "type": "json_schema", "json_schema": {...} } stellt strukturierte Ausgaben, die garantieren, dass das Modell Ihrem bereitgestellten JSON-Schema entspricht, sicher. Weitere Informationen finden Sie in der Anleitung „Strukturierte Ausgaben“.Das Festlegen auf { "type": "json_object" } aktiviert den JSON-Modus, der sicherstellt, dass die vom Modells generierte Meldung gültiger JSON-Code ist.Wichtig: Wenn Sie den JSON-Modus verwenden, müssen Sie selbst das Modell auch über eine System- oder Benutzernachricht anweisen, JSON-Code zu erzeugen. Andernfalls generiert das Modell möglicherweise einen unendlichen Leerzeichenstrom, bis der Tokengrenzwert erreicht wird. Dies kann zu einer lange ausgeführten und scheinbar „hängenden“ Anforderung führen. Beachten Sie auch, dass der Meldungsinhalt teilweise abgeschnitten werden kann, wenn Sie finish_reason="length" verwenden. Damit wird angegeben, dass bei der Generierung max_tokens überschritten wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat. |
No |
Eigenschaften für „tool_resources“
code_interpreter
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_ids | array | Eine Liste mit Datei-IDs, die für das Tool code_interpreter zur Verfügung gestellt wurden. Dem Tool können maximal 20 Dateien zugeordnet sein. |
[] |
file_search
Name | Typ | Beschreibung | Standard |
---|---|---|---|
vector_store_ids | array | Die ID des an diesen Assistenten angefügten Vektorspeichers. An den Assistenten kann maximal ein Vektorspeicher angefügt werden. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. |
Beispiele
Beispiel
Dient dazu, einen Thread in einer einzelnen Anforderung zu erstellen und auszuführen.
POST https://{endpoint}/openai/threads/runs?api-version=2024-12-01-preview
{
"assistant_id": "asst_abc123",
"thread": {
"messages": [
{
"role": "user",
"content": "Explain deep learning to a 5 year old."
}
]
}
}
Antworten: Statuscode: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699076792,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "queued",
"started_at": null,
"expires_at": 1699077392,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"required_action": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": "You are a helpful assistant.",
"tools": [],
"tool_resources": {},
"metadata": {},
"temperature": 1.0,
"top_p": 1.0,
"max_completion_tokens": null,
"max_prompt_tokens": null,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"incomplete_details": null,
"usage": null,
"response_format": "auto",
"tool_choice": "auto"
}
}
Auflisten: Ausführungen
GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2024-12-01-preview
Gibt eine Liste von Ausführungen zurück, die zu einem Thread gehören.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
limit | query | No | integer | |
Reihenfolge | query | No | Zeichenfolge | |
after | query | No | Zeichenfolge | |
before | query | No | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | listRunsResponse |
Beispiele
Beispiel
Gibt eine Liste von Ausführungen zurück, die zu einem Thread gehören.
GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"object": "list",
"data": [
{
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699075072,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699075072,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699075073,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
},
{
"id": "run_abc456",
"object": "thread.run",
"created_at": 1699063290,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699063290,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699063291,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
],
"first_id": "run_abc123",
"last_id": "run_abc456",
"has_more": false
}
}
Erstellen: Ausführung
POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2024-12-01-preview
Erstellen Sie eine Ausführung.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
include[] | Abfrage | No | array | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
assistant_id | Zeichenfolge | Die ID des Assistenten, der für diese Ausführung verwendet werden soll | Ja | |
Modell | Zeichenfolge | Die ID des Modells, das für diese Ausführung verwendet werden soll. Wenn hier ein Wert angegeben wird, überschreibt dieser das Modell, das dem Assistenten zugeordnet ist. Andernfalls wird das dem Assistenten zugeordnete Modell verwendet. | No | |
Setup | Zeichenfolge | Überschreibt die Standardsystemmeldung des Assistenten. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. | No | |
additional_instructions | Zeichenfolge | Fügt zusätzliche Anweisungen am Ende der Anweisungen für die Ausführung an. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern, ohne andere Anweisungen außer Kraft zu setzen. | No | |
additional_messages | array | Fügt dem Thread zusätzliche Nachrichten hinzu, bevor die Ausführung erstellt wird. | No | |
tools | array | Überschreibt die Tools, die der Assistent für diese Ausführung verwenden kann. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. | No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No | |
Temperatur | Zahl | Die zu verwendende Temperatur für die Stichprobenentnahme zwischen 0 und 2. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. |
No | 1 |
top_p | Zahl | Eine Alternative zur Stichprobenentnahme mit Temperatur, die sogenannte Kernstichprobenentnahme (Nucleus Sampling), bei dem das Modell die Ergebnisse der Token mit der Wahrscheinlichkeitsmasse „top_p“ berücksichtigt. Daher bedeutet 0,1, dass nur die Token berücksichtigt werden, die die oberen 10 % der Wahrscheinlichkeitsmasse umfassen. Wir empfehlen im Allgemeinen, dies oder die Temperatur zu ändern, aber nicht beides. |
No | 1 |
Datenstrom | boolean | Bei Verwendung von true wird ein Datenstrom von Ereignissen, die während der Ausführung auftreten, als vom Server gesendete Ereignisse zurückgegeben. Der Datenstrom wird beendet, wenn die Ausführung einen Endzustand mit einer Nachricht vom Typ data: [DONE] erreicht. |
No | |
max_prompt_tokens | integer | Die maximale Anzahl von Prompttokens, die im Laufe der Ausführung verwendet werden können. Bei der Ausführung wird bestmöglich versucht, über mehrere Durchläufe der Ausführung hinweg nur die angegebene Anzahl von Prompttoken zu verwenden. Wenn die Ausführung die angegebene Anzahl von Prompttoken überschreitet, endet die Ausführung mit dem Status incomplete . Weitere Informationen finden Sie unter incomplete_details . |
No | |
max_completion_tokens | integer | Die maximale Anzahl von Vervollständigungstokens, die im Laufe der Ausführung verwendet werden können. Bei der Ausführung wird bestmöglich versucht, über mehrere Durchläufe der Ausführung hinweg nur die angegebene Anzahl von Vervollständigungstoken zu verwenden. Wenn die Ausführung die angegebene Anzahl von Vervollständigungstoken überschreitet, endet die Ausführung mit dem Status incomplete . Weitere Informationen finden Sie unter incomplete_details . |
No | |
truncation_strategy | truncationObject | Steuert, wie ein Thread vor der Ausführung abgeschnitten wird. Verwenden Sie diese Option, um das anfängliche Kontextfenster der Ausführung zu steuern. | No | |
Toolauswahl | assistantsApiToolChoiceOption | Steuert, welches Tool (falls vorhanden) vom Modell aufgerufen wird.none bedeutet, dass das Modell kein Tool aufruft und stattdessen eine Meldung generiert.auto ist der Standardwert und bedeutet, dass das Modell zwischen dem Generieren einer Meldung und dem Aufrufen einer Funktion auswählen kann.Wenn Sie ein bestimmtes Tool wie {"type": "file_search"} oder {"type": "function", "function": {"name": "my_function"}} angeben, wird das Modell gezwungen, dieses aufzurufen. |
No | |
parallel_tool_calls | ParallelToolCalls | Gibt an, ob beim Verwenden des Tools parallele Funktionsaufrufe aktiviert werden sollen. | Nein | True |
response_format | assistantsApiResponseFormatOption | Gibt das Format an, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106 .Das Festlegen auf { "type": "json_schema", "json_schema": {...} } stellt strukturierte Ausgaben, die garantieren, dass das Modell Ihrem bereitgestellten JSON-Schema entspricht, sicher. Weitere Informationen finden Sie in der Anleitung „Strukturierte Ausgaben“.Das Festlegen auf { "type": "json_object" } aktiviert den JSON-Modus, der sicherstellt, dass die vom Modells generierte Meldung gültiger JSON-Code ist.Wichtig: Wenn Sie den JSON-Modus verwenden, müssen Sie selbst das Modell auch über eine System- oder Benutzernachricht anweisen, JSON-Code zu erzeugen. Andernfalls generiert das Modell möglicherweise einen unendlichen Leerzeichenstrom, bis der Tokengrenzwert erreicht wird. Dies kann zu einer lange ausgeführten und scheinbar „hängenden“ Anforderung führen. Beachten Sie auch, dass der Meldungsinhalt teilweise abgeschnitten werden kann, wenn Sie finish_reason="length" verwenden. Damit wird angegeben, dass bei der Generierung max_tokens überschritten wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat. |
No |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. |
Beispiele
Beispiel
Erstellen Sie eine Ausführung.
POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2024-12-01-preview
{
"assistant_id": "asst_abc123"
}
Antworten: Statuscode: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699063290,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "queued",
"started_at": 1699063290,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699063291,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
Abrufen: Ausführung
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2024-12-01-preview
Ruft eine Ausführung ab.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
run_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. |
Beispiele
Beispiel
Ruft eine Ausführung ab.
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "run_HsO8tYM4K5AAMAHgK0J3om8Q",
"object": "thread.run",
"created_at": 1707303196,
"assistant_id": "asst_JtTwHk28cIocgFXZPCBxhOzl",
"thread_id": "thread_eRNwflE3ncDYak1np6MdMHJh",
"status": "completed",
"started_at": 1707303197,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1707303201,
"last_error": null,
"model": "gpt-4-1106-preview",
"instructions": "You are an AI model that empowers every person and every organization on the planet to achieve more.",
"tools": [],
"file_ids": [],
"metadata": {}
}
}
Ändern: Ausführung
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2024-12-01-preview
Ändert eine Ausführung.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
run_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. |
Beispiele
Beispiel
Ändert eine Ausführung.
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2024-12-01-preview
{
"metadata": {
"user_id": "user_abc123"
}
}
Antworten: Statuscode: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699075072,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699075072,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699075073,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {
"user_id": "user_abc123"
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
Übermitteln: Toolausgaben für die Ausführung
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2024-12-01-preview
Wenn eine Ausführung den Status status: "requires_action"
hat und required_action.type
auf submit_tool_outputs
festgelegt ist, kann dieser Endpunkt zum Übermitteln der Ausgaben aus den Toolaufrufen verwendet werden, sobald sie alle abgeschlossen sind. Alle Ausgaben müssen in einer einzelnen Anforderung übermittelt werden.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
run_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
tool_outputs | array | Eine Liste der Tools, für die die Ausgaben übermittelt werden | Ja | |
Datenstrom | boolean | Bei Verwendung von true wird ein Datenstrom von Ereignissen, die während der Ausführung auftreten, als vom Server gesendete Ereignisse zurückgegeben. Der Datenstrom wird beendet, wenn die Ausführung einen Endzustand mit einer Nachricht vom Typ data: [DONE] erreicht. |
No |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. |
Beispiele
Beispiel
Wenn eine Ausführung den Status status: "requires_action"
hat und required_action.type
auf submit_tool_outputs
festgelegt ist, kann dieser Endpunkt zum Übermitteln der Ausgaben aus den Toolaufrufen verwendet werden, sobald sie alle abgeschlossen sind. Alle Ausgaben müssen in einer einzelnen Anforderung übermittelt werden.
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2024-12-01-preview
{
"tool_outputs": [
{
"tool_call_id": "call_001",
"output": "70 degrees and sunny."
}
]
}
Antworten: Statuscode: 200
{
"body": {
"id": "run_123",
"object": "thread.run",
"created_at": 1699075592,
"assistant_id": "asst_123",
"thread_id": "thread_123",
"status": "queued",
"started_at": 1699075592,
"expires_at": 1699076192,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"tools": [
{
"type": "function",
"function": {
"name": "get_current_weather",
"description": "Get the current weather in a given location",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city and state, e.g. San Francisco, CA"
},
"unit": {
"type": "string",
"enum": [
"celsius",
"fahrenheit"
]
}
},
"required": [
"location"
]
}
}
}
],
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
Abbrechen: Ausführung
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2024-12-01-preview
Bricht eine Ausführung ab, die den Status in_progress
aufweist.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
run_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. |
Beispiele
Beispiel
Bricht eine Ausführung ab, die den Status in_progress
aufweist.
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699076126,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "cancelling",
"started_at": 1699076126,
"expires_at": 1699076726,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": "You summarize books.",
"tools": [
{
"type": "file_search"
}
],
"tool_resources": {
"file_search": {
"vector_store_ids": [
"vs_123"
]
}
},
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"response_format": "auto"
}
}
Auflisten: Ausführungsschritte
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2024-12-01-preview
Gibt eine Liste von Ausführungsschritten zurück, die zu einer Ausführung gehören.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
run_id | path | Ja | Zeichenfolge | |
limit | query | No | integer | |
Reihenfolge | query | No | Zeichenfolge | |
after | query | No | Zeichenfolge | |
before | query | No | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge | API-Version |
include[] | Abfrage | No | array |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | listRunStepsResponse |
Beispiele
Beispiel
Gibt eine Liste von Ausführungsschritten zurück, die zu einer Ausführung gehören.
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"object": "list",
"data": [
{
"id": "step_abc123",
"object": "thread.run.step",
"created_at": 1699063291,
"run_id": "run_abc123",
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"type": "message_creation",
"status": "completed",
"cancelled_at": null,
"completed_at": 1699063291,
"expired_at": null,
"failed_at": null,
"last_error": null,
"step_details": {
"type": "message_creation",
"message_creation": {
"message_id": "msg_abc123"
}
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
}
}
],
"first_id": "step_abc123",
"last_id": "step_abc456",
"has_more": false
}
}
Abrufen: Ausführungsschritt
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2024-12-01-preview
Ruft einen Ausführungsschritt ab.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
thread_id | path | Ja | Zeichenfolge | |
run_id | path | Ja | Zeichenfolge | |
step_id | path | Ja | Zeichenfolge | |
include[] | Abfrage | No | array | |
api-version | query | Ja | Zeichenfolge | API-Version |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | runStepObject | Stellt einen Schritt in einer Ausführung dar. |
Beispiele
Beispiel
Ruft einen Ausführungsschritt ab.
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "step_abc123",
"object": "thread.run.step",
"created_at": 1699063291,
"run_id": "run_abc123",
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"type": "message_creation",
"status": "completed",
"cancelled_at": null,
"completed_at": 1699063291,
"expired_at": null,
"failed_at": null,
"last_error": null,
"step_details": {
"type": "message_creation",
"message_creation": {
"message_id": "msg_abc123"
}
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
}
}
}
Auflisten: Vektorspeicher
GET https://{endpoint}/openai/vector_stores?api-version=2024-12-01-preview
Gibt eine Liste mit Vektorspeichern zurück.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
limit | query | No | integer | |
Reihenfolge | query | No | Zeichenfolge | |
after | query | No | Zeichenfolge | |
before | query | No | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | listVectorStoresResponse |
Beispiele
Beispiel
Gibt eine Liste mit Vektorspeichern zurück.
GET https://{endpoint}/openai/vector_stores?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"object": "list",
"data": [
{
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
},
{
"id": "vs_abc456",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ v2",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
],
"first_id": "vs_abc123",
"last_id": "vs_abc456",
"has_more": false
}
}
Erstellen: Vektorspeicher
POST https://{endpoint}/openai/vector_stores?api-version=2024-12-01-preview
Erstellen Sie einen Vektorspeicher.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
api-version | query | Ja | Zeichenfolge |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
file_ids | array | Eine Liste mit Datei-IDs, die vom Vektorspeicher verwendet werden sollen. Nützlich für Tools wie file_search , die auf Dateien zugreifen können. |
No | |
name | Zeichenfolge | Der Name des Vektorspeichers. | No | |
expires_after | vectorStoreExpirationAfter | Die Ablaufrichtlinie für einen Vektorspeicher. | No | |
chunking_strategy | autoChunkingStrategyRequestParam oder staticChunkingStrategyRequestParam | Die Segmentierungsstrategie, die verwendet wird, um die Datei(en) in Blöcke zu unterteilen. Wenn kein Wert angegeben ist, wird die Strategie auto verwendet. Gilt nur, wenn file_ids nicht leer ist. |
No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | vectorStoreObject | Ein Vektorspeicher ist eine Sammlung verarbeiteter Dateien, die vom Tool file_search verwendet werden können. |
Beispiele
Beispiel
Erstellt einen Vektorspeicher.
POST https://{endpoint}/openai/vector_stores?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
}
Abrufen: Vektorspeicher
GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2024-12-01-preview
Ruft einen Vektorspeicher ab.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
vector_store_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | vectorStoreObject | Ein Vektorspeicher ist eine Sammlung verarbeiteter Dateien, die vom Tool file_search verwendet werden können. |
Beispiele
Beispiel
Ruft einen Vektorspeicher ab.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776
}
}
Ändern: Vektorspeicher
POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2024-12-01-preview
Ändert einen Vektorspeicher.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
vector_store_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
name | Zeichenfolge | Der Name des Vektorspeichers. | No | |
expires_after | vectorStoreExpirationAfter | Die Ablaufrichtlinie für einen Vektorspeicher. | No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | vectorStoreObject | Ein Vektorspeicher ist eine Sammlung verarbeiteter Dateien, die vom Tool file_search verwendet werden können. |
Beispiele
Beispiel
Ändert einen Vektorspeicher.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2024-12-01-preview
{
"name": "Support FAQ"
}
Antworten: Statuscode: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
}
Löschen: Vektorspeicher
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2024-12-01-preview
Löschen Sie einen Vektorspeicher.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
vector_store_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | deleteVectorStoreResponse |
Beispiele
Beispiel
Löscht einen Vektorspeicher.
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store.deleted",
"deleted": true
}
}
Auflisten: Vektorspeicherdateien
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2024-12-01-preview
Gibt eine Liste mit Vektorspeicherdateien zurück.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
vector_store_id | path | Ja | Zeichenfolge | |
limit | query | No | integer | |
Reihenfolge | query | No | Zeichenfolge | |
after | query | No | Zeichenfolge | |
before | query | No | Zeichenfolge | |
filter | query | No | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | listVectorStoreFilesResponse |
Beispiele
Beispiel
Gibt eine Liste mit Vektorspeicherdateien zurück.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"object": "list",
"data": [
{
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
},
{
"id": "file-abc456",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
}
],
"first_id": "file-abc123",
"last_id": "file-abc456",
"has_more": false
}
}
Erstellen: Vektorspeicherdatei
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2024-12-01-preview
Erstellen Sie eine Vektorspeicherdatei, indem Sie eine Datei an einen Vektorspeicher anfügen.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
vector_store_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
file_id | Zeichenfolge | Eine Datei-ID, die vom Vektorspeicher verwendet werden soll. Nützlich für Tools wie file_search , die auf Dateien zugreifen können. |
Ja | |
chunking_strategy | chunkingStrategyRequestParam | Die Segmentierungsstrategie, die verwendet wird, um die Datei(en) in Blöcke zu unterteilen. Wenn kein Wert angegeben ist, wird die Strategie auto verwendet. |
No |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | vectorStoreFileObject | Eine Liste der an einen Vektorspeicher angefügten Dateien. |
Beispiele
Beispiel
Erstellen Sie eine Vektorspeicherdatei, indem Sie eine Datei an einen Vektorspeicher anfügen.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2024-12-01-preview
{
"file_id": "file-abc123"
}
Antworten: Statuscode: 200
{
"body": {
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"usage_bytes": 1234,
"vector_store_id": "vs_abcd",
"status": "completed",
"last_error": null
}
}
Abrufen: Vektorspeicherdatei
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2024-12-01-preview
Ruft eine Vektorspeicherdatei ab.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
vector_store_id | path | Ja | Zeichenfolge | |
file_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | vectorStoreFileObject | Eine Liste der an einen Vektorspeicher angefügten Dateien. |
Beispiele
Beispiel
Ruft eine Vektorspeicherdatei ab.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abcd",
"status": "completed",
"last_error": null
}
}
Löschen: Vektorspeicherdatei
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2024-12-01-preview
Löschen Sie eine Vektorspeicherdatei. Dadurch wird die Datei aus dem Vektorspeicher entfernt. Die Datei selbst wird jedoch nicht gelöscht. Verwenden Sie zum Löschen der Datei den dafür vorgesehenen Endpunkt.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
vector_store_id | path | Ja | Zeichenfolge | |
file_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | deleteVectorStoreFileResponse |
Beispiele
Beispiel
Löschen Sie eine Vektorspeicherdatei. Dadurch wird die Datei aus dem Vektorspeicher entfernt. Die Datei selbst wird jedoch nicht gelöscht. Verwenden Sie zum Löschen der Datei den dafür vorgesehenen Endpunkt.
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "file_abc123",
"object": "vector_store.file.deleted",
"deleted": true
}
}
Erstellen: Vektorspeicher-Dateibatch
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2024-12-01-preview
Erstellen Sie einen Vektorspeicher-Dateibatch.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
vector_store_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Anforderungstext
Content-Type: application/json
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
file_ids | array | Eine Liste mit Datei-IDs, die vom Vektorspeicher verwendet werden sollen. Nützlich für Tools wie file_search , die auf Dateien zugreifen können. |
Ja | |
chunking_strategy | chunkingStrategyRequestParam | Die Segmentierungsstrategie, die verwendet wird, um die Datei(en) in Blöcke zu unterteilen. Wenn kein Wert angegeben ist, wird die Strategie auto verwendet. |
No |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | vectorStoreFileBatchObject | Eine Gruppe von Dateien, die an einen Vektorspeicher angefügt sind. |
Beispiele
Beispiel
Erstellen Sie einen Vektorspeicher-Dateibatch.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2024-12-01-preview
{
"file_ids": [
"file-abc123",
"file-abc456"
]
}
Antworten: Statuscode: 200
{
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "in_progress",
"file_counts": {
"in_progress": 1,
"completed": 1,
"failed": 0,
"cancelled": 0,
"total": 0
}
}
Abrufen: Vektorspeicher-Dateibatch
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2024-12-01-preview
Ruft einen Vektorspeicher-Dateibatch ab.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
vector_store_id | path | Ja | Zeichenfolge | |
batch_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | vectorStoreFileBatchObject | Eine Gruppe von Dateien, die an einen Vektorspeicher angefügt sind. |
Beispiele
Beispiel
Ruft einen Vektorspeicher-Dateibatch ab.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "in_progress",
"file_counts": {
"in_progress": 1,
"completed": 1,
"failed": 0,
"cancelled": 0,
"total": 0
}
}
}
Abbrechen: Vektorspeicher-Dateibatch
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2024-12-01-preview
Brechen Sie einen Vektorspeicher-Dateibatch ab. Dadurch wird versucht, die Verarbeitung von Dateien in diesem Batch so schnell wie möglich abzubrechen.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
vector_store_id | path | Ja | Zeichenfolge | |
batch_id | path | Ja | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | vectorStoreFileBatchObject | Eine Gruppe von Dateien, die an einen Vektorspeicher angefügt sind. |
Beispiele
Beispiel
Brechen Sie einen Vektorspeicher-Dateibatch ab. Dadurch wird versucht, die Verarbeitung von Dateien in diesem Batch so schnell wie möglich abzubrechen.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "cancelling",
"file_counts": {
"in_progress": 12,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 15
}
}
}
Auflisten: Dateien eines Vektorspeicher-Dateibatchs
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2024-12-01-preview
Gibt eine Liste mit Vektorspeicherdateien in einem Batch zurück.
URI-Parameter
Name | Geben Sie in | Erforderlich | Type | Beschreibung |
---|---|---|---|---|
endpoint | path | Ja | Zeichenfolge url |
Unterstützte Azure OpenAI-Endpunkte (Protokoll und Hostname, z. B. https://aoairesource.openai.azure.com . Ersetzen Sie „aoairesource“ durch den Namen Ihrer Azure OpenAI-Ressource.) https://{Name Ihrer Ressource}.openai.azure.com |
vector_store_id | path | Ja | Zeichenfolge | |
batch_id | path | Ja | Zeichenfolge | |
limit | query | No | integer | |
Reihenfolge | query | No | Zeichenfolge | |
after | query | No | Zeichenfolge | |
before | query | No | Zeichenfolge | |
filter | query | No | Zeichenfolge | |
api-version | query | Ja | Zeichenfolge |
Anforderungsheader
Name | Erforderlich | Type | Beschreibung |
---|---|---|---|
api-key | True | Zeichenfolge | Geben Sie hier den Azure OpenAI-API-Schlüssel an. |
Antworten
Statuscode: 200
Beschreibung: OK
Content-Type | Typ | Beschreibung |
---|---|---|
application/json | listVectorStoreFilesResponse |
Beispiele
Beispiel
Gibt eine Liste mit Vektorspeicherdateien zurück.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2024-12-01-preview
Antworten: Statuscode: 200
{
"body": {
"object": "list",
"data": [
{
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
},
{
"id": "file-abc456",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
}
],
"first_id": "file-abc123",
"last_id": "file-abc456",
"has_more": false
}
}
Komponenten
errorResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
error | error | No |
errorBase
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Code | string | Nein | ||
message | Zeichenfolge | No |
error
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
param | Zeichenfolge | Nein | ||
Typ | Zeichenfolge | No | ||
inner_error | innerError | Innerer Fehler mit zusätzlichen Details. | No |
innerError
Innerer Fehler mit zusätzlichen Details.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
code | innerErrorCode | Fehlercodes für das innere Fehlerobjekt | No | |
content_filter_results | contentFilterPromptResults | Informationen zur Inhaltsfilterkategorie („hate“, „sexual“, „violence“, „self_harm“), sofern sie erkannt wurde, und zum Schweregrad („very_low“, „low“, „medium“, „high-scale“, um die Intensität und Risikostufe schädlicher Inhalte zu bestimmen) sowie dazu, ob der Inhalt gefiltert wurde. Informationen zu Jailbreak-Inhalten und Profanität, sofern diese erkannt wurden, sowie dazu, ob der Inhalt gefiltert wurde. Außerdem Informationen zur Kundenblockliste, wenn diese gefiltert wurde, und ihre ID. | No |
innerErrorCode
Fehlercodes für das innere Fehlerobjekt
Beschreibung: Fehlercodes für das innere Fehlerobjekt
Typ: string
Standardwert:
Enumerationsname: InnerErrorCode
Enumerationswerte:
Wert | Beschreibung |
---|---|
ResponsibleAIPolicyViolation | Der Prompt verstieß gegen eine von mehreren Inhaltsfilterregeln. |
dalleErrorResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
error | dalleError | No |
dalleError
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
param | Zeichenfolge | Nein | ||
Typ | Zeichenfolge | No | ||
inner_error | dalleInnerError | Innerer Fehler mit zusätzlichen Details. | No |
dalleInnerError
Innerer Fehler mit zusätzlichen Details.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
code | innerErrorCode | Fehlercodes für das innere Fehlerobjekt | No | |
content_filter_results | dalleFilterResults | Informationen zur Inhaltsfilterkategorie („hate“, „sexual“, „violence“, „self_harm“), sofern sie erkannt wurde, und zum Schweregrad („very_low“, „low“, „medium“, „high-scale“, um die Intensität und Risikostufe schädlicher Inhalte zu bestimmen) sowie dazu, ob der Inhalt gefiltert wurde. Informationen zu Jailbreak-Inhalten und Profanität, sofern diese erkannt wurden, sowie dazu, ob der Inhalt gefiltert wurde. Außerdem Informationen zur Kundenblockliste, wenn diese gefiltert wurde, und ihre ID. | No | |
revised_prompt | Zeichenfolge | Der Prompt, der zum Generieren des Bilds verwendet wurde, wenn der Prompts überarbeitet wurde | No |
contentFilterCompletionTextSpan
Beschreibt eine Spanne innerhalb des generierten Vervollständigungstexts. Offset 0 ist der erste UTF32-Codepunkt des Vervollständigungstexts.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
completion_start_offset | integer | Offset des UTF32-Codepunkts, mit dem die Spanne beginnt. | Ja | |
completion_end_offset | integer | Offset des ersten UTF32-Codepunkts, der von der Spanne ausgeschlossen ist. Dieses Feld entspricht bei leeren Spannen immer „completion_start_offset“. Dieses Feld ist bei nicht leeren Spannen immer größer als „completion_start_offset“. | Ja |
contentFilterResultBase
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
filtered | boolean | Ja |
contentFilterSeverityResult
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
filtered | boolean | Ja | ||
severity | Zeichenfolge | No |
contentFilterDetectedResult
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
filtered | boolean | Ja | ||
detected | boolean | Nein |
contentFilterDetectedWithCitationResult
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
citation | Objekt | No |
Eigenschaften für „citation“
URL
Name | Typ | Beschreibung | Standard |
---|---|---|---|
URL | Zeichenfolge |
license
Name | Typ | Beschreibung | Standard |
---|---|---|---|
license | Zeichenfolge |
contentFilterDetectedWithCompletionTextSpansResult
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
details | array | No |
contentFilterIdResult
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
filtered | boolean | Ja | ||
id | Zeichenfolge | No |
contentFilterResultsBase
Informationen zu den Ergebnissen der Inhaltsfilterung
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
sexual | contentFilterSeverityResult | No | ||
violence | contentFilterSeverityResult | No | ||
hate | contentFilterSeverityResult | No | ||
self_harm | contentFilterSeverityResult | No | ||
profanity | contentFilterDetectedResult | No | ||
custom_blocklists | contentFilterDetailedResults | Ergebnisse der Inhaltsfilterung mit Inhaltsfilter-IDs für die gefilterten Segmente als Detailinformation. | No | |
error | errorBase | No |
contentFilterPromptResults
Informationen zur Inhaltsfilterkategorie („hate“, „sexual“, „violence“, „self_harm“), sofern sie erkannt wurde, und zum Schweregrad („very_low“, „low“, „medium“, „high-scale“, um die Intensität und Risikostufe schädlicher Inhalte zu bestimmen) sowie dazu, ob der Inhalt gefiltert wurde. Informationen zu Jailbreak-Inhalten und Profanität, sofern diese erkannt wurden, sowie dazu, ob der Inhalt gefiltert wurde. Außerdem Informationen zur Kundenblockliste, wenn diese gefiltert wurde, und ihre ID.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
sexual | contentFilterSeverityResult | No | ||
violence | contentFilterSeverityResult | No | ||
hate | contentFilterSeverityResult | No | ||
self_harm | contentFilterSeverityResult | No | ||
profanity | contentFilterDetectedResult | No | ||
custom_blocklists | contentFilterDetailedResults | Ergebnisse der Inhaltsfilterung mit Inhaltsfilter-IDs für die gefilterten Segmente als Detailinformation. | No | |
error | errorBase | No | ||
Jailbreak | contentFilterDetectedResult | No | ||
indirect_attack | contentFilterDetectedResult | No |
contentFilterChoiceResults
Informationen zur Inhaltsfilterkategorie („hate“, „sexual“, „violence“, „self_harm“), zur Erkennung und zum Schweregrad („very_low“, „low“, „medium“, „high-scale“, um die Intensität und Risikostufe schädlicher Inhalte zu bestimmen) sowie dazu, ob eine Filterung erfolgt ist. Informationen zu Text und Obszönitäten von Dritten, zur Erkennung und dazu, ob eine Filterung erfolgt ist. Außerdem Informationen zur Kundensperrliste und zur Filterung sowie die zugehörige ID.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
sexual | contentFilterSeverityResult | No | ||
violence | contentFilterSeverityResult | No | ||
hate | contentFilterSeverityResult | No | ||
self_harm | contentFilterSeverityResult | No | ||
profanity | contentFilterDetectedResult | No | ||
custom_blocklists | contentFilterDetailedResults | Ergebnisse der Inhaltsfilterung mit Inhaltsfilter-IDs für die gefilterten Segmente als Detailinformation. | No | |
error | errorBase | No | ||
protected_material_text | contentFilterDetectedResult | No | ||
protected_material_code | contentFilterDetectedWithCitationResult | No | ||
ungrounded_material | contentFilterDetectedWithCompletionTextSpansResult | No |
contentFilterDetailedResults
Ergebnisse der Inhaltsfilterung mit Inhaltsfilter-IDs für die gefilterten Segmente als Detailinformation.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
filtered | boolean | Ja | ||
details | array | No |
promptFilterResult
Ergebnisse der Inhaltsfilterung für einen einzelnen Prompt in der Anforderung
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
prompt_index | integer | No | ||
content_filter_results | contentFilterPromptResults | Informationen zur Inhaltsfilterkategorie („hate“, „sexual“, „violence“, „self_harm“), sofern sie erkannt wurde, und zum Schweregrad („very_low“, „low“, „medium“, „high-scale“, um die Intensität und Risikostufe schädlicher Inhalte zu bestimmen) sowie dazu, ob der Inhalt gefiltert wurde. Informationen zu Jailbreak-Inhalten und Profanität, sofern diese erkannt wurden, sowie dazu, ob der Inhalt gefiltert wurde. Außerdem Informationen zur Kundenblockliste, wenn diese gefiltert wurde, und ihre ID. | No |
promptFilterResults
Ergebnisse der Inhaltsfilterung für null oder mehr Prompts in der Anforderung. Bei einer Streaminganforderung können Ergebnisse für unterschiedliche Prompts zu unterschiedlichen Zeiten oder in unterschiedlicher Reihenfolge eingehen.
Für diese Komponente sind keine Eigenschaften definiert.
dalleContentFilterResults
Informationen zu den Ergebnissen der Inhaltsfilterung
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
sexual | contentFilterSeverityResult | No | ||
violence | contentFilterSeverityResult | No | ||
hate | contentFilterSeverityResult | No | ||
self_harm | contentFilterSeverityResult | No |
dalleFilterResults
Informationen zur Inhaltsfilterkategorie („hate“, „sexual“, „violence“, „self_harm“), sofern sie erkannt wurde, und zum Schweregrad („very_low“, „low“, „medium“, „high-scale“, um die Intensität und Risikostufe schädlicher Inhalte zu bestimmen) sowie dazu, ob der Inhalt gefiltert wurde. Informationen zu Jailbreak-Inhalten und Profanität, sofern diese erkannt wurden, sowie dazu, ob der Inhalt gefiltert wurde. Außerdem Informationen zur Kundenblockliste, wenn diese gefiltert wurde, und ihre ID.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
sexual | contentFilterSeverityResult | No | ||
violence | contentFilterSeverityResult | No | ||
hate | contentFilterSeverityResult | No | ||
self_harm | contentFilterSeverityResult | No | ||
profanity | contentFilterDetectedResult | No | ||
Jailbreak | contentFilterDetectedResult | No | ||
custom_blocklists | contentFilterDetailedResults | Ergebnisse der Inhaltsfilterung mit Inhaltsfilter-IDs für die gefilterten Segmente als Detailinformation. | No |
chatCompletionsRequestCommon
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Temperatur | Zahl | Die zu verwendende Temperatur für die Stichprobenentnahme zwischen 0 und 2. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. Wir empfehlen im Allgemeinen, dies oder top_p zu ändern, aber nicht beides. |
No | 1 |
top_p | Zahl | Eine Alternative zur Stichprobenentnahme mit Temperatur, die sogenannte Kernstichprobenentnahme (Nucleus Sampling), bei dem das Modell die Ergebnisse der Token mit der Wahrscheinlichkeitsmasse „top_p“ berücksichtigt. Daher bedeutet 0,1, dass nur die Token berücksichtigt werden, die die oberen 10 % der Wahrscheinlichkeitsmasse umfassen. Wir empfehlen im Allgemeinen, dies oder temperature zu ändern, aber nicht beides. |
No | 1 |
Datenstrom | boolean | Wenn diese Einstellung festgelegt ist, werden teilweise Nachrichtendeltas gesendet, wie in ChatGPT. Token werden als vom Server gesendete Ereignisse (reine Daten) übermittelt, sobald sie verfügbar sind. Der Stream wird durch eine data: [DONE] -Nachricht beendet. |
No | False |
stop | Zeichenfolge oder Array | Bis zu vier Sequenzen, in denen die API aufhört, weitere Token zu generieren. | No | |
max_tokens | integer | Die maximale Anzahl von Token, die für die generierte Antwort zulässig sind. Standardmäßig ist die Anzahl der vom Modell zurückgegebenen Token (4.096 – Prompttoken). Dies ist nicht mit Modellen der o1-Serie kompatibel. | No | 4\.096 |
max_completion_tokens | integer | Eine obere Grenze für die Anzahl der Tokens, die für eine Vervollständigung generiert werden können, einschließlich sichtbarer Ausgabetokens und Begründungstokens. Dies wird nur bei Modellen der o1-Serie unterstützt. Die Unterstützung wird in einer zukünftigen API-Version auf andere Modelle ausgeweitet. | No | |
presence_penalty | Zahl | Eine Zahl zwischen -2,0 und 2,0. Positive Werte benachteiligen neue Token, je nachdem, ob sie bereits im Text vorkommen, und erhöhen so die Wahrscheinlichkeit, dass das Modell über neue Themen spricht. | No | 0 |
frequency_penalty | Zahl | Eine Zahl zwischen -2,0 und 2,0. Positive Werte benachteiligen neue Token auf der Grundlage ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit, dass das Modell dieselbe Zeile wortwörtlich wiederholt, sinkt. | No | 0 |
logit_bias | Objekt | Ändern Sie die Wahrscheinlichkeit, dass bestimmte Token in der Vervollständigung vorkommen. Akzeptiert ein JSON-Objekt, das Token (angegeben durch ihre Token-ID im Tokenizer) einem zugehörigen Verzerrungswert von -100 bis 100 zuordnet. Mathematisch gesehen wird die Verzerrung zu den Logits addiert, die das Modell vor der Stichprobenentnahme generiert. Die genaue Auswirkung ist von Modell zu Modell unterschiedlich, aber Werte zwischen -1 und 1 sollten die Wahrscheinlichkeit der Auswahl verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Verbot oder einer ausschließlichen Auswahl des betreffenden Tokens führen. | No | |
store | boolean | Gibt an, ob die Ausgabe dieser Chatvervollständigungsanforderung für die Verwendung in unseren Modelldestillations- oder Evaluierungsprodukten gespeichert werden soll. | No | |
metadata | Objekt | Entwicklerdefinierte Tags und Werte, die zum Filtern von Fertigstellungen im Dashboard für gespeicherte Fertigstellungen verwendet werden. | No | |
user | Zeichenfolge | Ein eindeutiger Bezeichner, der Ihren Endbenutzer darstellt und Azure OpenAI bei der Überwachung und Erkennung von Missbrauch helfen kann. | No |
createCompletionRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
prompt | Zeichenfolge oder Array | Die Prompts zum Generieren von Vervollständigungen, die als Zeichenfolge, Array von Zeichenfolgen, Array von Token oder Array von Tokenarrays codiert werden. Beachten Sie, dass <|endoftext|> das Dokumententrennzeichen ist, das das Modell während des Trainings sieht. Wenn also kein Prompt angegeben wird, wird die Generierung des Modells wie am Anfang eines neuen Dokuments durchgeführt. |
Ja | |
best_of | integer | Generiert serverseitige best_of -Vervollständigungen und gibt die „beste“ zurück (diejenige mit der höchsten logarithmierten Wahrscheinlichkeit pro Token). Die Ergebnisse können nicht gestreamt werden.Wenn Sie diese Funktion zusammen mit n verwenden, steuert best_of die Anzahl der möglichen Vervollständigungen, und n gibt an, wie viele zurückgegeben werden sollen – best_of muss größer als n sein.Hinweis: Da dieser Parameter viele Vervollständigungen generiert, kann Ihr Tokenkontingent schnell aufgebraucht sein. Verwenden Sie ihn sorgfältig und stellen Sie sicher, dass Sie angemessene Einstellungen für max_tokens und stop verwenden. |
No | 1 |
Echo | boolean | Geben Sie die Äußerung zusätzlich zur Vervollständigung zurück. |
No | False |
frequency_penalty | Zahl | Eine Zahl zwischen -2,0 und 2,0. Positive Werte benachteiligen neue Token auf der Grundlage ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit, dass das Modell dieselbe Zeile wortwörtlich wiederholt, sinkt. |
No | 0 |
logit_bias | Objekt | Ändern Sie die Wahrscheinlichkeit, dass bestimmte Token in der Vervollständigung vorkommen. Akzeptiert ein JSON-Objekt, das Token (angegeben durch ihre Token-ID im GPT-Tokenizer) einem zugehörigen Tendenzwert von -100 bis 100 zuordnet. Mathematisch gesehen wird die Verzerrung zu den Logits addiert, die das Modell vor der Stichprobenentnahme generiert. Die genaue Auswirkung ist von Modell zu Modell unterschiedlich, aber Werte zwischen -1 und 1 sollten die Wahrscheinlichkeit der Auswahl verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Verbot oder einer ausschließlichen Auswahl des betreffenden Tokens führen. Sie können beispielsweise {"50256": -100} übergeben, um zu verhindern, dass das Token <|endoftext|> generiert wird. |
No | Keine |
logprobs | integer | Beziehen Sie die logarithmierten Wahrscheinlichkeiten für die wahrscheinlichsten Token von logprobs sowie die ausgewählten Ausgabetoken ein. Wenn logprobs z. B. „5“ ist, gibt die API eine Liste mit den fünf wahrscheinlichsten Tokens zurück. Die API gibt immer logprob des Tokens der Stichprobenentnahme zurück, sodass die Antwort bis zu logprobs+1 Elemente enthalten kann.Der Höchstwert für logprobs ist 5. |
No | Keine |
max_tokens | integer | Die maximale Anzahl von Token, die in der Vervollständigung generiert werden können. Die Tokenanzahl Ihres Prompts plus max_tokens darf die Kontextlänge des Modells nicht überschreiten. |
Nein | 16 |
n | integer | Wie viele Vervollständigungen für jede Äußerung generiert werden sollen. Hinweis: Da dieser Parameter viele Vervollständigungen generiert, kann Ihr Tokenkontingent schnell aufgebraucht sein. Verwenden Sie ihn sorgfältig und stellen Sie sicher, dass Sie angemessene Einstellungen für max_tokens und stop verwenden. |
No | 1 |
presence_penalty | Zahl | Eine Zahl zwischen -2,0 und 2,0. Positive Werte benachteiligen neue Token, je nachdem, ob sie bereits im Text vorkommen, und erhöhen so die Wahrscheinlichkeit, dass das Modell über neue Themen spricht. |
No | 0 |
seed | integer | Wenn Sie dies angeben, bemüht sich unser System nach besten Kräften, eine deterministische Auswahl zu treffen, sodass wiederholte Anforderungen mit demselben seed und denselben Parametern dasselbe Ergebnis liefern sollten.Der Determinismus ist nicht garantiert, und Sie sollten auf den system_fingerprint Antwortparameter verweisen, um Änderungen im Back-End zu überwachen. |
No | |
stop | Zeichenfolge oder Array | Bis zu vier Sequenzen, in denen die API aufhört, weitere Token zu generieren. Der zurückgegebene Text wird die Beendigungssequenz nicht enthalten. |
No | |
Datenstrom | boolean | Gibt an, ob der Teilfortschritt zurückgestreamt werden soll. Wenn dieser Parameter festgelegt wird, werden Token als vom Server gesendete Ereignisse (nur Daten) übermittelt, sobald sie verfügbar sind, wobei der Stream durch die Nachricht data: [DONE] beendet wird. |
No | False |
Suffix | Zeichenfolge | Das Suffix, das nach einer Vervollständigung des eingefügten Texts folgt. Der Parameter wird nur von gpt-3.5-turbo-instruct unterstützt. |
No | Keine |
Temperatur | Zahl | Die zu verwendende Temperatur für die Stichprobenentnahme zwischen 0 und 2. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. Wir empfehlen im Allgemeinen, dies oder top_p zu ändern, aber nicht beides. |
No | 1 |
top_p | Zahl | Eine Alternative zur Stichprobenentnahme mit Temperatur, die sogenannte Kernstichprobenentnahme (Nucleus Sampling), bei dem das Modell die Ergebnisse der Token mit der Wahrscheinlichkeitsmasse „top_p“ berücksichtigt. Daher bedeutet 0,1, dass nur die Token berücksichtigt werden, die die oberen 10 % der Wahrscheinlichkeitsmasse umfassen. Wir empfehlen im Allgemeinen, dies oder temperature zu ändern, aber nicht beides. |
No | 1 |
user | Zeichenfolge | Ein eindeutiger Bezeichner, der Ihr Endbenutzerkonto darstellt und bei der Überwachung und Erkennung von Missbrauch helfen kann. |
No |
createCompletionResponse
Stellt eine Vervollständigungsantwort der API dar. Hinweis: Sowohl die gestreamten als auch nicht gestreamten Antwortobjekte verwenden dieselbe Form (im Gegensatz zum Chatendpunkt).
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Eindeutiger Bezeichner für die Vervollständigung | Ja | |
Optionen | array | Die Liste der Vervollständigungsoptionen, die das Modell für die Eingabeaufforderung generiert hat | Ja | |
erstellte | integer | Der Unix-Zeitstempel (in Sekunden) des Zeitpunkts, zu dem die Vervollständigung erstellt wurde | Ja | |
Modell | Zeichenfolge | Das für die Vervollständigung verwendete Modell | Ja | |
prompt_filter_results | promptFilterResults | Ergebnisse der Inhaltsfilterung für null oder mehr Prompts in der Anforderung. Bei einer Streaminganforderung können Ergebnisse für unterschiedliche Prompts zu unterschiedlichen Zeiten oder in unterschiedlicher Reihenfolge eingehen. | No | |
system_fingerprint | Zeichenfolge | Dieser Fingerabdruck stellt die Back-End-Konfiguration dar, mit der das Modell ausgeführt wird. Kann zusammen mit dem Anforderungsparameter seed verwendet werden, um zu verstehen, wann Back-End-Änderungen vorgenommen wurden, die sich auf den Determinismus auswirken können. |
No | |
Objekt | enum | Der Objekttyp, der immer „text_completion“ lautet Mögliche Werte: text_completion |
Ja | |
Nutzung | completionUsage | Nutzungsstatistiken für die Vervollständigungsanforderung | No |
createChatCompletionRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Temperatur | Zahl | Die zu verwendende Temperatur für die Stichprobenentnahme zwischen 0 und 2. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. Wir empfehlen im Allgemeinen, dies oder top_p zu ändern, aber nicht beides. |
No | 1 |
top_p | Zahl | Eine Alternative zur Stichprobenentnahme mit Temperatur, die sogenannte Kernstichprobenentnahme (Nucleus Sampling), bei dem das Modell die Ergebnisse der Token mit der Wahrscheinlichkeitsmasse „top_p“ berücksichtigt. Daher bedeutet 0,1, dass nur die Token berücksichtigt werden, die die oberen 10 % der Wahrscheinlichkeitsmasse umfassen. Wir empfehlen im Allgemeinen, dies oder temperature zu ändern, aber nicht beides. |
No | 1 |
Datenstrom | boolean | Wenn diese Einstellung festgelegt ist, werden teilweise Nachrichtendeltas gesendet, wie in ChatGPT. Token werden als vom Server gesendete Ereignisse (reine Daten) übermittelt, sobald sie verfügbar sind, wobei der Stream durch eine data: [DONE] -Nachricht beendet wird |
No | False |
stop | Zeichenfolge oder Array | Bis zu vier Sequenzen, in denen die API aufhört, weitere Token zu generieren. |
No | |
max_tokens | integer | Die maximale Anzahl von Token, die in der Chatvervollständigung generiert werden können. Die Gesamtlänge der Eingabetoken und generierten Token wird durch die Kontextlänge des Modells begrenzt. |
No | |
max_completion_tokens | integer | Eine obere Grenze für die Anzahl der Tokens, die für eine Vervollständigung generiert werden können, einschließlich sichtbarer Ausgabetokens und Begründungstokens. Dies wird nur bei Modellen der o1-Serie unterstützt. Die Unterstützung wird in einer zukünftigen API-Version auf andere Modelle ausgeweitet. | No | |
presence_penalty | Zahl | Eine Zahl zwischen -2,0 und 2,0. Positive Werte benachteiligen neue Token, je nachdem, ob sie bereits im Text vorkommen, und erhöhen so die Wahrscheinlichkeit, dass das Modell über neue Themen spricht. |
No | 0 |
frequency_penalty | Zahl | Eine Zahl zwischen -2,0 und 2,0. Positive Werte benachteiligen neue Token auf der Grundlage ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit, dass das Modell dieselbe Zeile wortwörtlich wiederholt, sinkt. |
No | 0 |
logit_bias | Objekt | Ändern Sie die Wahrscheinlichkeit, dass bestimmte Token in der Vervollständigung vorkommen. Ein JSON-Objekt, das Token (angegeben durch die Token-ID im Tokenizer) einem zugehörigen Verzerrungswert von –100 bis 100 zuordnet. Mathematisch gesehen wird die Verzerrung zu den Logits addiert, die das Modell vor der Stichprobenentnahme generiert. Die genaue Auswirkung ist von Modell zu Modell unterschiedlich, aber Werte zwischen -1 und 1 sollten die Wahrscheinlichkeit der Auswahl verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Verbot oder einer ausschließlichen Auswahl des betreffenden Tokens führen. |
No | Keine |
store | boolean | Gibt an, ob die Ausgabe dieser Chatvervollständigungsanforderung für die Verwendung in unseren Modelldestillations- oder Evaluierungsprodukten gespeichert werden soll. | No | |
metadata | Objekt | Entwicklerdefinierte Tags und Werte, die zum Filtern von Fertigstellungen im Dashboard für gespeicherte Fertigstellungen verwendet werden. | No | |
user | Zeichenfolge | Ein eindeutiger Bezeichner, der Ihr Endbenutzerkonto darstellt und bei der Überwachung und Erkennung von Missbrauch helfen kann. |
No | |
Cloud an das Gerät | array | Eine Liste der Nachrichten, aus denen die Unterhaltung bisher besteht. | Ja | |
data_sources | array | Die Konfigurationseinträge für Azure OpenAI-Chaterweiterungen, die sie verwenden. Diese zusätzliche Spezifikation ist nur mit Azure OpenAI kompatibel. |
No | |
reasoning_effort | enum | Nur o1-Modelle Schränkt den Begründungsaufwand ein für Begründungsmodelle. Derzeit werden die Werte low , medium und high unterstützt. Das Reduzieren von Begründungen kann zu schnelleren Antworten und weniger Token führen, die bei der Begründung in einer Antwort verwendet werden.Mögliche Werte: Niedrig, Mittel, Hoch |
No | |
logprobs | boolean | Gibt an, ob Protokollwahrscheinlichkeiten der Ausgabetoken zurückgegeben werden sollen. Wenn wahr, gibt die Protokollwahrscheinlichkeiten jedes Ausgabetokens zurück, das in der content von message zurückgegeben wird. |
No | False |
top_logprobs | integer | Eine ganze Zahl zwischen 0 und 20, die die Anzahl der höchstwahrscheinlichen Token an jeder Tokenposition angibt, jeweils mit einer zugeordneten Protokollwahrscheinlichkeit. logprobs muss auf true festgelegt werden, wenn dieser Parameter verwendet wird. |
No | |
n | integer | Wie viele Optionen für die Chatvervollständigung für jede Eingabenachricht generiert werden sollen. Beachten Sie, dass Ihnen die Anzahl der generierten Tokens für alle Auswahlmöglichkeiten in Rechnung gestellt wird. Behalten Sie n als 1 , um die Kosten zu minimieren. |
No | 1 |
parallel_tool_calls | ParallelToolCalls | Gibt an, ob beim Verwenden des Tools parallele Funktionsaufrufe aktiviert werden sollen. | Nein | True |
response_format | ResponseFormatText oder ResponseFormatJsonObject oder ResponseFormatJsonSchema | Ein Objekt, das das Format angibt, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4o mini, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen, die neuer als gpt-3.5-turbo-1106 sind.Die Einstellung auf { "type": "json_schema", "json_schema": {...} } ermöglicht strukturierte Ausgaben, die garantieren, dass das Modell Ihrem bereitgestellten JSON-Schema entspricht.Wenn Sie ihn auf { "type": "json_object" } festlegen, wird der JSON-Modus aktiviert, der sicherstellt, dass die vom Modells generierte Meldung gültiger JSON-Code ist.Wichtig: Wenn Sie den JSON-Modus verwenden, müssen Sie selbst das Modell auch über eine System- oder Benutzernachricht anweisen, JSON-Code zu erzeugen. Andernfalls generiert das Modell möglicherweise einen unendlichen Leerzeichenstrom, bis der Tokengrenzwert erreicht wird. Dies kann zu einer lange ausgeführten und scheinbar „hängenden“ Anforderung führen. Beachten Sie auch, dass der Meldungsinhalt teilweise abgeschnitten werden kann, wenn Sie finish_reason="length" verwenden. Damit wird angegeben, dass bei der Generierung max_tokens überschritten wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat. |
No | |
seed | integer | Dieses Feature befindet sich in der Betaversion. Wenn Sie dies angeben, bemüht sich unser System nach besten Kräften, eine deterministische Auswahl zu treffen, sodass wiederholte Anforderungen mit demselben seed und denselben Parametern dasselbe Ergebnis liefern sollten.Der Determinismus ist nicht garantiert, und Sie sollten auf den system_fingerprint Antwortparameter verweisen, um Änderungen im Back-End zu überwachen. |
No | |
stream_options | chatCompletionStreamOptions | Optionen für eine Streamingantwort. Legen Sie dies nur fest, wenn Sie stream: true festlegen. |
No | Keine |
tools | array | Eine Liste der Tools, die das Modell aufrufen kann. Derzeit werden nur Funktionen als Tool unterstützt. Verwenden Sie diesen Parameter, um eine Liste der Funktionen anzugeben, für die das Modell JSON-Eingaben generieren kann. Es werden maximal 128 Funktionen unterstützt. |
No | |
Toolauswahl | chatCompletionToolChoiceOption | Steuert, welches Tool (falls vorhanden) vom Modell aufgerufen wird. none bedeutet, dass das Modell keine Tools aufruft und stattdessen eine Meldung generiert. auto bedeutet, dass das Modell zwischen dem Generieren einer Meldung und dem Aufrufen von Tools wählen kann. required bedeutet, dass das Modell mindestens ein Tool aufrufen muss. Wenn Sie mit {"type": "function", "function": {"name": "my_function"}} ein bestimmtes Tool angeben, wird das Modell gezwungen, dieses aufzurufen. none ist die Standardeinstellung, wenn keine Tools vorhanden sind. auto ist die Standardeinstellung, wenn Tools vorhanden sind. |
No | |
function_call | string oder chatCompletionFunctionCallOption | Zugunsten von tool_choice eingestellt.Steuert, welche Funktion (falls vorhanden) vom Modell aufgerufen wird. none bedeutet, dass das Modell keine Funktion aufruft und stattdessen eine Nachricht generiert.auto bedeutet, dass das Modell zwischen dem Generieren einer Meldung und dem Aufrufen einer Funktion auswählen kann.Wenn Sie über {"name": "my_function"} eine bestimmte Funktion angeben, wird das Modell gezwungen, diese aufzurufen.none ist die Standardeinstellung, wenn keine Funktionen vorhanden sind. auto ist die Standardeinstellung, wenn Funktionen vorhanden sind. |
No | |
functions | array | Zugunsten von tools eingestellt.Eine Liste der Funktionen, für die das Modell JSON-Eingaben generieren kann. |
No | |
user_security_context | userSecurityContext | Der Benutzersicherheitskontext enthält mehrere Parameter, die die KI-Anwendung selbst beschreiben, und den Endbenutzer, der mit der KI-Anwendung interagiert. Diese Felder helfen Ihren Sicherheitsteams dabei, Sicherheitsvorfälle zu untersuchen und zu mindern, da sie einen umfassenden Ansatz zum Schutz Ihrer KI-Anwendungen bieten. Erfahren Sie mehr über den Schutz von KI-Anwendungen mithilfe von Microsoft Defender for Cloud. | No |
userSecurityContext
Der Benutzersicherheitskontext enthält mehrere Parameter, die die KI-Anwendung selbst beschreiben, und den Endbenutzer, der mit der KI-Anwendung interagiert. Diese Felder helfen Ihren Sicherheitsteams dabei, Sicherheitsvorfälle zu untersuchen und zu mindern, da sie einen umfassenden Ansatz zum Schutz Ihrer KI-Anwendungen bieten. Erfahren Sie mehr über den Schutz von KI-Anwendungen mithilfe von Microsoft Defender for Cloud.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
application_name | Zeichenfolge | Der Namen der Anwendung. Es sollten keine vertraulichen personenbezogenen Daten in diesem Feld enthalten sein. | No | |
end_user_id | Zeichenfolge | Dieser Bezeichner ist die Benutzerobjekt-ID von Microsoft Entra ID (früher Azure Active Directory), die zur Authentifizierung von Endbenutzern innerhalb der generativen KI-Anwendung verwendet wird. Es sollten keine vertraulichen personenbezogenen Daten in diesem Feld enthalten sein. | No | |
end_user_tenant_id | Zeichenfolge | Die Microsoft 365-Mandanten-ID, zu der der Endbenutzer gehört. Sie ist erforderlich, wenn die generative KI-Anwendung mehrinstanzenfähig ist. | No | |
source_ip | Zeichenfolge | Erfasst die IP-Adresse des ursprünglichen Clients, wobei sowohl IPv4- als auch IPv6-Formate akzeptiert werden. | No |
chatCompletionFunctions
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Beschreibung | string | Eine Beschreibung des Zwecks der Funktion, die vom Modell verwendet wird, um auszuwählen, wann und wie die Funktion aufgerufen wird. | No | |
name | Zeichenfolge | Der Name der Funktion, die aufgerufen werden soll. Muss aus a–z, A–Z, 0–9 bestehen oder Unterstriche und Bindestriche enthalten, maximale Länge: 64. | Ja | |
Parameter | FunctionParameters | Die von den Funktionen akzeptierten Parameter beschrieben als JSON-Schemaobjekt. Beispiele finden Sie in der Anleitung](https://learn.microsoft.com/azure/ai-services/openai/how-to/function-calling) und die Dokumentation zum Format in der JSON-Schemareferenz. Wenn parameters weggelassen wird, wird eine Funktion mit einer leeren Parameterliste definiert. |
No |
chatCompletionFunctionCallOption
Wenn Sie über {"name": "my_function"}
eine bestimmte Funktion angeben, wird das Modell gezwungen, diese aufzurufen.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
name | Zeichenfolge | Der Name der aufzurufenden Funktion. | Ja |
chatCompletionFunctionParameters
Die von den Funktionen akzeptierten Parameter beschrieben als JSON-Schemaobjekt. Beispiele finden Sie in der Anleitung guide/ und die Dokumentation zum Format finden Sie in der JSON-Schemareferenz.
Für diese Komponente sind keine Eigenschaften definiert.
chatCompletionRequestMessage
Mögliche Werte für diese Komponente:
ChatCompletionRequestDeveloperMessage
Vom Entwickler bereitgestellte Anweisungen, die das Modell befolgen sollte, unabhängig von Nachrichten, die vom Benutzer gesendet wurden.
Bei o1-Modellen und neueren Modellen ersetzen developer
-Nachrichten die vorherigen system
-Nachrichten.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Inhalt | Zeichenfolge oder Array | Der Inhalt der Entwicklernachricht. | Ja | |
role | enum | Die Rolle des Nachrichtenerstellers (in diesem Fall: developer ).Mögliche Werte: Entwickler |
Ja | |
Name | Zeichenfolge | Ein optionaler Name für den Teilnehmer. Stellt die Modellinformationen bereit, um zwischen den Teilnehmern derselben Rolle zu unterscheiden. | No |
chatCompletionRequestSystemMessage
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Inhalt | Zeichenfolge oder Array | Die Inhalte der Systemnachricht. | Ja | |
role | enum | Die Rolle des Nachrichtenerstellers (in diesem Fall: system ).Mögliche Werte: system |
Yes | |
Name | Zeichenfolge | Ein optionaler Name für den Teilnehmer. Stellt die Modellinformationen bereit, um zwischen den Teilnehmern derselben Rolle zu unterscheiden. | No |
chatCompletionRequestUserMessage
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Inhalt | Zeichenfolge oder Array | Die Inhalte der Benutzernachricht. |
Ja | |
role | enum | Die Rolle des Nachrichtenerstellers (in diesem Fall: user ).Mögliche Werte: user |
Yes | |
Name | Zeichenfolge | Ein optionaler Name für den Teilnehmer. Stellt die Modellinformationen bereit, um zwischen den Teilnehmern derselben Rolle zu unterscheiden. | No |
chatCompletionRequestAssistantMessage
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Inhalt | Zeichenfolge oder Array | Die Inhalte der Assistentennachricht. Erforderlich, es sei denn, tool_calls oder function_call ist angegeben. |
No | |
Ablehnung | Zeichenfolge | Die Ablehnungsnachricht des Assistenten. | No | |
role | enum | Die Rolle des Nachrichtenerstellers (in diesem Fall: assistant ).Mögliche Werte: assistant |
Yes | |
Name | Zeichenfolge | Ein optionaler Name für den Teilnehmer. Stellt die Modellinformationen bereit, um zwischen den Teilnehmern derselben Rolle zu unterscheiden. | No | |
tool_calls | chatCompletionMessageToolCalls | Die vom Modell generierten Toolaufrufe, z. B. Funktionsaufrufe. | No | |
function_call | Objekt | Veraltet und durch tool_calls ersetzt. Der Name und die Argumente einer Funktion, die aufgerufen werden soll, wie sie vom Modell generiert werden. |
No |
Eigenschaften für function_call
Argumente
Name | Typ | Beschreibung | Standard |
---|---|---|---|
Argumente | Zeichenfolge | Die Argumente, mit denen die Funktion aufgerufen werden soll, wie sie vom Modell im JSON-Format generiert werden. Beachten Sie, dass das Modell nicht immer gültige JSON-Werte und möglicherweise Parameter generiert, die nicht durch Ihr Funktionsschema definiert sind. Überprüfen Sie die Argumente im Code, bevor Sie Ihre Funktion aufrufen. |
name
Name | Typ | Beschreibung | Standard |
---|---|---|---|
name | Zeichenfolge | Der Name der aufzurufenden Funktion. |
chatCompletionRequestToolMessage
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
role | enum | Die Rolle des Nachrichtenerstellers (in diesem Fall: tool ).Mögliche Werte: tool |
Ja | |
content | Zeichenfolge oder Array | Die Inhalte der Toolnachricht. | Ja | |
tool_call_id | Zeichenfolge | Toolaufruf, auf den diese Nachricht reagiert. | Ja |
chatCompletionRequestFunctionMessage
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
role | enum | Die Rolle des Nachrichtenerstellers (in diesem Fall: function ).Mögliche Werte: function |
Ja | |
content | Zeichenfolge | Die Inhalte der Funktionsmeldung. | Yes | |
Name | Zeichenfolge | Der Name der aufzurufenden Funktion. | Ja |
chatCompletionRequestDeveloperMessageContentPart
Mögliche Werte für diese Komponente:
chatCompletionRequestSystemMessageContentPart
Mögliche Werte für diese Komponente:
chatCompletionRequestUserMessageContentPart
Mögliche Werte für diese Komponente:
chatCompletionRequestAssistantMessageContentPart
Mögliche Werte für diese Komponente:
chatCompletionRequestToolMessageContentPart
Mögliche Werte für diese Komponente:
chatCompletionRequestMessageContentPartText
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | enum | Der Typ des Inhaltsteils Mögliche Werte: text |
Ja | |
Text | Zeichenfolge | Der Textinhalt. | Ja |
chatCompletionRequestMessageContentPartImage
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | enum | Der Typ des Inhaltsteils Mögliche Werte: image_url |
Ja | |
image_url | Objekt | Ja |
Eigenschaften für image_url
url
Name | Typ | Beschreibung | Standard |
---|---|---|---|
url | Zeichenfolge | Entweder eine URL des Bilds oder die base64-codierten Bilddaten |
detail
Name | Typ | Beschreibung | Standard |
---|---|---|---|
detail | Zeichenfolge | Gibt den Detailgrad des Bilds an. Weitere Informationen finden Sie im Leitfaden für Vision. | auto |
chatCompletionRequestMessageContentPartRefusal
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | enum | Der Typ des Inhaltsteils Mögliche Werte: refusal |
Ja | |
Ablehnung | Zeichenfolge | Eine vom Modell generierte Ablehnungsmeldung. | Ja |
azureChatExtensionConfiguration
Eine Darstellung der Konfigurationsdaten für eine einzelne Azure OpenAI-Chaterweiterung. Wird von einer Chatvervollständigungsanforderung verwendet, die das Antwortverhalten mithilfe von Azure OpenAI-Chaterweiterungen verbessern soll. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | azureChatExtensionType | Eine Darstellung der Konfigurationsdaten für eine einzelne Azure OpenAI-Chaterweiterung. Wird von einer Chatvervollständigungsanforderung verwendet, die das Antwortverhalten mithilfe von Azure OpenAI-Chaterweiterungen verbessern soll. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel. |
Ja |
azureChatExtensionType
Eine Darstellung der Konfigurationsdaten für eine einzelne Azure OpenAI-Chaterweiterung. Wird von einer Chatvervollständigungsanforderung verwendet, die das Antwortverhalten mithilfe von Azure OpenAI-Chaterweiterungen verbessern soll. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.
Beschreibung: Eine Darstellung der Konfigurationsdaten einer einzelnen Azure OpenAI-Chaterweiterung. Wird von einer Chatvervollständigungsanforderung
verwendet, die das Antwortverhalten mithilfe von Azure OpenAI-Chaterweiterungen verbessern soll.
Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.
Typ: string
Standardwert:
Enumerationsname: AzureChatExtensionType
Enumerationswerte:
Wert | Beschreibung |
---|---|
azure_search | Stellt die Verwendung von Azure Search als Azure OpenAI-Chaterweiterung dar |
azure_cosmos_db | Stellt die Verwendung von Azure Cosmos DB als Azure OpenAI-Chaterweiterung dar. |
elasticsearch | Stellt die Verwendung des Elasticsearch®-Index als Azure OpenAI-Chaterweiterung dar. |
mongo_db | Stellt die Verwendung von Mongo DB als Azure OpenAI-Chaterweiterung dar. |
pinecone | Stellt die Verwendung des Pinecone-Index als Azure OpenAI-Chaterweiterung dar. |
azureSearchChatExtensionConfiguration
Eine spezifische Darstellung konfigurierbarer Optionen für Azure Search, wenn Azure Search als Azure OpenAI-Chaterweiterung verwendet wird
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | azureChatExtensionType | Eine Darstellung der Konfigurationsdaten für eine einzelne Azure OpenAI-Chaterweiterung. Wird von einer Chatvervollständigungsanforderung verwendet, die das Antwortverhalten mithilfe von Azure OpenAI-Chaterweiterungen verbessern soll. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel. |
Ja | |
Parameter | azureSearchChatExtensionParameters | Parameter für Azure Search, wenn Azure Search als Azure OpenAI-Chaterweiterung verwendet wird | No |
azureSearchChatExtensionParameters
Parameter für Azure Search, wenn Azure Search als Azure OpenAI-Chaterweiterung verwendet wird
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
authentication | onYourDataApiKeyAuthenticationOptions, onYourDataSystemAssignedManagedIdentityAuthenticationOptions, onYourDataUserAssignedManagedIdentityAuthenticationOptions oder onYourDataAccessTokenAuthenticationOptions | Ja | ||
top_n_documents | integer | Die konfigurierte maximale Anzahl von Dokumenten, die für die konfigurierte Abfrage bereitgestellt werden sollen. | No | |
max_search_queries | integer | Die maximale Anzahl umgeschriebener Abfragen, die für eine einzelne Benutzernachricht an den Suchanbieter gesendet werden sollte. Falls nicht angegeben, entscheidet das System über die Anzahl der Abfragen, die gesendet werden sollen | No | |
allow_partial_result | boolean | Wenn TRUE angegeben wird, lässt das System die Verwendung von partiellen Suchergebnissen zu, und die Anforderung schlägt fehl, wenn alle Abfragen fehlschlagen. Falls nicht oder als FALSE angegeben, schlägt die Anforderung fehl, wenn eine Suchabfrage fehlschlägt | No | False |
in_scope | boolean | Gibt an, ob Abfragen auf die Verwendung von indizierten Daten beschränkt werden sollen. | No | |
strictness | integer | Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher der Genauigkeit, aber desto der niedrigerer Antwortabruf. | No | |
endpoint | Zeichenfolge | Der absolute Endpunktpfad für die zu verwendende Azure Search-Ressource. | Ja | |
index_name | Zeichenfolge | Der Name des zu verwendenden Index gemäß Angabe in der referenzierten Azure Search-Ressource. | Ja | |
fields_mapping | azureSearchIndexFieldMappingOptions | Optionale Einstellungen zum Steuern der Verarbeitung von Feldern bei Verwendung einer konfigurierten Azure Search-Ressource. | No | |
query_type | azureSearchQueryType | Der Typ der Azure Search-Abrufabfrage, die bei Verwendung als Azure OpenAI-Chaterweiterung ausgeführt werden soll | No | |
semantic_configuration | Zeichenfolge | Die zusätzliche semantische Konfiguration für die Abfrage. | No | |
filter | Zeichenfolge | Suchfilter. | No | |
embedding_dependency | onYourDataEndpointVectorizationSource oder onYourDataDeploymentNameVectorizationSource oder onYourDataIntegratedVectorizationSource | No | ||
include_contexts | array | Enthaltenen Eigenschaften des Ausgabekontexts. Falls nicht angegeben, lautet der Standardwert citations und intent . |
No |
azureSearchIndexFieldMappingOptions
Optionale Einstellungen zum Steuern der Verarbeitung von Feldern bei Verwendung einer konfigurierten Azure Search-Ressource.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
title_field | Zeichenfolge | Der Name des Indexfelds, das als Titel verwendet werden soll | No | |
url_field | Zeichenfolge | Der Name des Indexfelds, das als URL verwendet werden soll | No | |
filepath_field | Zeichenfolge | Der Name des Indexfelds, das als Dateipfad verwendet werden soll. | No | |
content_fields | array | Die Namen von Indexfeldern, die als Inhalt behandelt werden sollen. | No | |
content_fields_separator | Zeichenfolge | Das Trennmuster, das Inhaltsfelder verwenden sollen. | No | |
vector_fields | array | Die Namen von Feldern, die Vektordaten darstellen. | No | |
image_vector_fields | array | Die Namen von Feldern, die Bildvektordaten darstellen. | No |
azureSearchQueryType
Der Typ der Azure Search-Abrufabfrage, die bei Verwendung als Azure OpenAI-Chaterweiterung ausgeführt werden soll
Beschreibung: Der Typ der Azure Search-Abrufabfrage, die bei Verwendung als Azure OpenAI-Chaterweiterung ausgeführt werden soll
Typ: string
Standardwert:
Enumerationsname: AzureSearchQueryType
Enumerationswerte:
Wert | Beschreibung |
---|---|
Einfach | Stellt den standardmäßigen einfachen Abfrageparser dar. |
semantisch | Stellt den Semantikabfrageparser für die erweiterte semantische Modellierung dar. |
vector | Stellt die Vektorsuche über berechnete Daten dar. |
vector_simple_hybrid | Stellt eine Kombination der einfachen Abfragestrategie mit Vektordaten dar. |
vector_semantic_hybrid | Stellt eine Kombination aus semantischer Suche und Vektordatenabfrage dar. |
azureCosmosDBChatExtensionConfiguration
Eine spezifische Darstellung konfigurierbarer Optionen für Azure Cosmos DB, wenn Azure Cosmos DB als Azure OpenAI-Chaterweiterung verwendet wird
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | azureChatExtensionType | Eine Darstellung der Konfigurationsdaten für eine einzelne Azure OpenAI-Chaterweiterung. Wird von einer Chatvervollständigungsanforderung verwendet, die das Antwortverhalten mithilfe von Azure OpenAI-Chaterweiterungen verbessern soll. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel. |
Ja | |
Parameter | azureCosmosDBChatExtensionParameters | Zu verwendende Parameter beim Konfigurieren von Azure OpenAI On Your Data-Chaterweiterungen, wenn Sie Azure Cosmos DB for MongoDB vCore verwenden. |
No |
azureCosmosDBChatExtensionParameters
Zu verwendende Parameter beim Konfigurieren von Azure OpenAI On Your Data-Chaterweiterungen, wenn Sie Azure Cosmos DB for MongoDB vCore verwenden
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
authentication | onYourDataConnectionStringAuthenticationOptions | Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung einer Verbindungszeichenfolge | Ja | |
top_n_documents | integer | Die konfigurierte maximale Anzahl von Dokumenten, die für die konfigurierte Abfrage bereitgestellt werden sollen. | No | |
max_search_queries | integer | Die maximale Anzahl umgeschriebener Abfragen, die für eine einzelne Benutzernachricht an den Suchanbieter gesendet werden sollte. Falls nicht angegeben, entscheidet das System über die Anzahl der Abfragen, die gesendet werden sollen | No | |
allow_partial_result | boolean | Wenn TRUE angegeben wird, lässt das System die Verwendung von partiellen Suchergebnissen zu, und die Anforderung schlägt fehl, wenn alle Abfragen fehlschlagen. Falls nicht oder als FALSE angegeben, schlägt die Anforderung fehl, wenn eine Suchabfrage fehlschlägt | No | False |
in_scope | boolean | Gibt an, ob Abfragen auf die Verwendung von indizierten Daten beschränkt werden sollen. | No | |
strictness | integer | Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher der Genauigkeit, aber desto der niedrigerer Antwortabruf. | No | |
database_name | Zeichenfolge | Der Name der MongoDB vCore-Datenbank, die mit Azure Cosmos DB verwendet werden soll | Ja | |
container_name | Zeichenfolge | Der Name des Azure Cosmos DB-Ressourcencontainers | Ja | |
index_name | Zeichenfolge | Der Name des MongoDB vCore-Index, der mit Azure Cosmos DB verwendet werden soll | Ja | |
fields_mapping | azureCosmosDBFieldMappingOptions | Optionale Einstellungen zum Steuern der Verarbeitung von Feldern bei Verwendung einer konfigurierten Azure Cosmos DB-Ressource | Ja | |
embedding_dependency | onYourDataEndpointVectorizationSource oder onYourDataDeploymentNameVectorizationSource | Ja | ||
include_contexts | array | Enthaltenen Eigenschaften des Ausgabekontexts. Falls nicht angegeben, lautet der Standardwert citations und intent . |
No |
azureCosmosDBFieldMappingOptions
Optionale Einstellungen zum Steuern der Verarbeitung von Feldern bei Verwendung einer konfigurierten Azure Cosmos DB-Ressource
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
title_field | Zeichenfolge | Der Name des Indexfelds, das als Titel verwendet werden soll | No | |
url_field | Zeichenfolge | Der Name des Indexfelds, das als URL verwendet werden soll | No | |
filepath_field | Zeichenfolge | Der Name des Indexfelds, das als Dateipfad verwendet werden soll. | No | |
content_fields | array | Die Namen von Indexfeldern, die als Inhalt behandelt werden sollen. | Ja | |
content_fields_separator | Zeichenfolge | Das Trennmuster, das Inhaltsfelder verwenden sollen. | No | |
vector_fields | array | Die Namen von Feldern, die Vektordaten darstellen. | Ja |
elasticsearchChatExtensionConfiguration
Eine spezifische Darstellung konfigurierbarer Optionen für Elasticsearch, wenn Elasticsearch als Azure OpenAI-Chaterweiterung verwendet wird.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | azureChatExtensionType | Eine Darstellung der Konfigurationsdaten für eine einzelne Azure OpenAI-Chaterweiterung. Wird von einer Chatvervollständigungsanforderung verwendet, die das Antwortverhalten mithilfe von Azure OpenAI-Chaterweiterungen verbessern soll. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel. |
Ja | |
Parameter | elasticsearchChatExtensionParameters | Zu verwendende Parameter beim Konfigurieren von Elasticsearch® als Azure OpenAI-Chaterweiterung. | No |
elasticsearchChatExtensionParameters
Zu verwendende Parameter beim Konfigurieren von Elasticsearch® als Azure OpenAI-Chaterweiterung.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
authentication | onYourDataKeyAndKeyIdAuthenticationOptions oder onYourDataEncodedApiKeyAuthenticationOptions | Ja | ||
top_n_documents | integer | Die konfigurierte maximale Anzahl von Dokumenten, die für die konfigurierte Abfrage bereitgestellt werden sollen. | No | |
max_search_queries | integer | Die maximale Anzahl umgeschriebener Abfragen, die für eine einzelne Benutzernachricht an den Suchanbieter gesendet werden sollte. Falls nicht angegeben, entscheidet das System über die Anzahl der Abfragen, die gesendet werden sollen | No | |
allow_partial_result | boolean | Wenn TRUE angegeben wird, lässt das System die Verwendung von partiellen Suchergebnissen zu, und die Anforderung schlägt fehl, wenn alle Abfragen fehlschlagen. Falls nicht oder als FALSE angegeben, schlägt die Anforderung fehl, wenn eine Suchabfrage fehlschlägt | No | False |
in_scope | boolean | Gibt an, ob Abfragen auf die Verwendung von indizierten Daten beschränkt werden sollen. | No | |
strictness | integer | Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher der Genauigkeit, aber desto der niedrigerer Antwortabruf. | No | |
endpoint | Zeichenfolge | Der Endpunkt von Elasticsearch®. | Ja | |
index_name | Zeichenfolge | Der Indexname von Elasticsearch®. | Ja | |
fields_mapping | elasticsearchIndexFieldMappingOptions | Optionale Einstellungen zum Steuern der Verarbeitung von Feldern bei Verwendung einer konfigurierten Elasticsearch®-Ressource. | No | |
query_type | elasticsearchQueryType | Der Typ der Elasticsearch®-Abrufabfrage, die bei Verwendung als Azure OpenAI-Chaterweiterung ausgeführt werden soll. | No | |
embedding_dependency | onYourDataEndpointVectorizationSource, onYourDataDeploymentNameVectorizationSource oder onYourDataModelIdVectorizationSource | No | ||
include_contexts | array | Enthaltenen Eigenschaften des Ausgabekontexts. Falls nicht angegeben, lautet der Standardwert citations und intent . |
No |
elasticsearchIndexFieldMappingOptions
Optionale Einstellungen zum Steuern der Verarbeitung von Feldern bei Verwendung einer konfigurierten Elasticsearch®-Ressource.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
title_field | Zeichenfolge | Der Name des Indexfelds, das als Titel verwendet werden soll | No | |
url_field | Zeichenfolge | Der Name des Indexfelds, das als URL verwendet werden soll | No | |
filepath_field | Zeichenfolge | Der Name des Indexfelds, das als Dateipfad verwendet werden soll. | No | |
content_fields | array | Die Namen von Indexfeldern, die als Inhalt behandelt werden sollen. | No | |
content_fields_separator | Zeichenfolge | Das Trennmuster, das Inhaltsfelder verwenden sollen. | No | |
vector_fields | array | Die Namen von Feldern, die Vektordaten darstellen. | No |
elasticsearchQueryType
Der Typ der Elasticsearch®-Abrufabfrage, die bei Verwendung als Azure OpenAI-Chaterweiterung ausgeführt werden soll.
Beschreibung: Der Typ der Elasticsearch®-Abrufabfrage, die bei Verwendung als Azure OpenAI-Chaterweiterung ausgeführt werden soll.
Typ: string
Standardwert:
Enumerationsname: ElasticsearchQueryType
Enumerationswerte:
Wert | Beschreibung |
---|---|
Einfach | Stellt den standardmäßigen einfachen Abfrageparser dar. |
vector | Stellt die Vektorsuche über berechnete Daten dar. |
mongoDBChatExtensionConfiguration
Eine spezifische Darstellung konfigurierbarer Optionen für Mongo DB, wenn Mongo DB als Azure OpenAI-Chaterweiterung verwendet wird.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | azureChatExtensionType | Eine Darstellung der Konfigurationsdaten für eine einzelne Azure OpenAI-Chaterweiterung. Wird von einer Chatvervollständigungsanforderung verwendet, die das Antwortverhalten mithilfe von Azure OpenAI-Chaterweiterungen verbessern soll. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel. |
Ja | |
Parameter | mongoDBChatExtensionParameters | Zu verwendende Parameter beim Konfigurieren von Azure OpenAI On Your Data-Chaterweiterungen, wenn Sie Mongo DB verwenden. | No |
mongoDBChatExtensionParameters
Zu verwendende Parameter beim Konfigurieren von Azure OpenAI On Your Data-Chaterweiterungen, wenn Sie Mongo DB verwenden.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
authentication | onYourDataUsernameAndPasswordAuthenticationOptions | Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung von Benutzername und Kennwort. | Ja | |
top_n_documents | integer | Die konfigurierte maximale Anzahl von Dokumenten, die für die konfigurierte Abfrage bereitgestellt werden sollen. | No | |
max_search_queries | integer | Die maximale Anzahl umgeschriebener Abfragen, die für eine einzelne Benutzernachricht an den Suchanbieter gesendet werden sollte. Falls nicht angegeben, entscheidet das System über die Anzahl der Abfragen, die gesendet werden sollen | No | |
allow_partial_result | boolean | Wenn TRUE angegeben wird, lässt das System die Verwendung von partiellen Suchergebnissen zu, und die Anforderung schlägt fehl, wenn alle Abfragen fehlschlagen. Falls nicht oder als FALSE angegeben, schlägt die Anforderung fehl, wenn eine Suchabfrage fehlschlägt | No | False |
in_scope | boolean | Gibt an, ob Abfragen auf die Verwendung von indizierten Daten beschränkt werden sollen. | No | |
strictness | integer | Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher der Genauigkeit, aber desto der niedrigerer Antwortabruf. | No | |
endpoint | Zeichenfolge | Der Name des Mongo DB-Clusterendpunkts. | Ja | |
database_name | Zeichenfolge | Der Name der Mongo DB-Datenbank. | Ja | |
collection_name | Zeichenfolge | Der Name der Mongo DB-Collection. | Ja | |
app_name | Zeichenfolge | Der Name der Mongo DB-Anwendung. | Ja | |
index_name | Zeichenfolge | Der Name des Mongo DB-Index. | Ja | |
fields_mapping | mongoDBFieldMappingOptions | Optionale Einstellungen zum Steuern der Verarbeitung von Feldern bei Verwendung einer konfigurierten Mongo DB-Ressource. | Ja | |
embedding_dependency | onYourDataEndpointVectorizationSource oder onYourDataDeploymentNameVectorizationSource | Ja | ||
include_contexts | array | Enthaltenen Eigenschaften des Ausgabekontexts. Falls nicht angegeben, lautet der Standardwert citations und intent . |
No |
mongoDBFieldMappingOptions
Optionale Einstellungen zum Steuern der Verarbeitung von Feldern bei Verwendung einer konfigurierten Mongo DB-Ressource.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
title_field | Zeichenfolge | Der Name des Indexfelds, das als Titel verwendet werden soll | No | |
url_field | Zeichenfolge | Der Name des Indexfelds, das als URL verwendet werden soll | No | |
filepath_field | Zeichenfolge | Der Name des Indexfelds, das als Dateipfad verwendet werden soll. | No | |
content_fields | array | Die Namen von Indexfeldern, die als Inhalt behandelt werden sollen. | Ja | |
content_fields_separator | Zeichenfolge | Das Trennmuster, das Inhaltsfelder verwenden sollen. | No | |
vector_fields | array | Die Namen von Feldern, die Vektordaten darstellen. | Ja |
pineconeChatExtensionConfiguration
Eine spezifische Darstellung konfigurierbarer Optionen für Pinecone, wenn Pinecone als Azure OpenAI-Chaterweiterung verwendet wird.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | azureChatExtensionType | Eine Darstellung der Konfigurationsdaten für eine einzelne Azure OpenAI-Chaterweiterung. Wird von einer Chatvervollständigungsanforderung verwendet, die das Antwortverhalten mithilfe von Azure OpenAI-Chaterweiterungen verbessern soll. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel. |
Ja | |
Parameter | pineconeChatExtensionParameters | Parameter zum Konfigurieren von Azure OpenAI-Chaterweiterungen vom Typ „Pinecone“. | No |
pineconeChatExtensionParameters
Parameter zum Konfigurieren von Azure OpenAI-Chaterweiterungen vom Typ „Pinecone“.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
authentication | onYourDataApiKeyAuthenticationOptions | Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung eines API-Schlüssels. | Ja | |
top_n_documents | integer | Die konfigurierte maximale Anzahl von Dokumenten, die für die konfigurierte Abfrage bereitgestellt werden sollen. | No | |
max_search_queries | integer | Die maximale Anzahl umgeschriebener Abfragen, die für eine einzelne Benutzernachricht an den Suchanbieter gesendet werden sollte. Falls nicht angegeben, entscheidet das System über die Anzahl der Abfragen, die gesendet werden sollen | No | |
allow_partial_result | boolean | Wenn TRUE angegeben wird, lässt das System die Verwendung von partiellen Suchergebnissen zu, und die Anforderung schlägt fehl, wenn alle Abfragen fehlschlagen. Falls nicht oder als FALSE angegeben, schlägt die Anforderung fehl, wenn eine Suchabfrage fehlschlägt | No | False |
in_scope | boolean | Gibt an, ob Abfragen auf die Verwendung von indizierten Daten beschränkt werden sollen. | No | |
strictness | integer | Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher der Genauigkeit, aber desto der niedrigerer Antwortabruf. | No | |
Umgebung | Zeichenfolge | Der Umgebungsname von Pinecone. | Ja | |
index_name | Zeichenfolge | Der Name des Pinecone-Datenbankindex. | Ja | |
fields_mapping | pineconeFieldMappingOptions | Optionale Einstellungen zum Steuern der Verarbeitung von Feldern bei Verwendung einer konfigurierten Pinecone-Ressource. | Ja | |
embedding_dependency | onYourDataDeploymentNameVectorizationSource | Die Details einer Vektorisierungsquelle, die von Azure OpenAI On Your Data beim Anwenden der Vektorsuche verwendet wird – basierend auf einem internen Namen der Einbettung der Modellimplementierung in der gleichen Azure OpenAI-Ressource. |
Ja | |
include_contexts | array | Enthaltenen Eigenschaften des Ausgabekontexts. Falls nicht angegeben, lautet der Standardwert citations und intent . |
No |
pineconeFieldMappingOptions
Optionale Einstellungen zum Steuern der Verarbeitung von Feldern bei Verwendung einer konfigurierten Pinecone-Ressource.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
title_field | Zeichenfolge | Der Name des Indexfelds, das als Titel verwendet werden soll | No | |
url_field | Zeichenfolge | Der Name des Indexfelds, das als URL verwendet werden soll | No | |
filepath_field | Zeichenfolge | Der Name des Indexfelds, das als Dateipfad verwendet werden soll. | No | |
content_fields | array | Die Namen von Indexfeldern, die als Inhalt behandelt werden sollen. | Ja | |
content_fields_separator | Zeichenfolge | Das Trennmuster, das Inhaltsfelder verwenden sollen. | No |
onYourDataAuthenticationOptions
Die Authentifizierungsoptionen für Azure OpenAI On Your Data
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | onYourDataAuthenticationType | Die unterstützten Authentifizierungstypen für Azure OpenAI On Your Data | Ja |
onYourDataContextProperty
Die Kontexteigenschaft.
Beschreibung: Die Kontexteigenschaft.
Typ: string
Standardwert:
Enumerationsname: OnYourDataContextProperty
Enumerationswerte:
Wert | Beschreibung |
---|---|
citations | Die citations -Eigenschaft |
Absicht | Die intent -Eigenschaft |
all_retrieved_documents | Die all_retrieved_documents -Eigenschaft |
onYourDataAuthenticationType
Die unterstützten Authentifizierungstypen für Azure OpenAI On Your Data
Beschreibung: Die unterstützten Authentifizierungstypen für Azure OpenAI On Your Data
Typ: string
Standardwert:
Enumerationsname: OnYourDataAuthenticationType
Enumerationswerte:
Wert | Beschreibung |
---|---|
api_key | Authentifizierung per API-Schlüssel |
connection_string | Authentifizierung per Verbindungszeichenfolge. |
key_and_key_id | Authentifizierung per Schlüssel- und Schlüssel-ID-Paar. |
encoded_api_key | Authentifizierung per codiertem API-Schlüssel. |
access_token | Authentifizierung per Zugriffstoken. |
system_assigned_managed_identity | Authentifizierung per systemseitig zugewiesener verwalteter Identität |
user_assigned_managed_identity | Authentifizierung per benutzerseitig zugewiesener verwalteter Identität |
username_and_password | Authentifizierung per Benutzername und Kennwort |
onYourDataApiKeyAuthenticationOptions
Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung eines API-Schlüssels.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | onYourDataAuthenticationType | Die unterstützten Authentifizierungstypen für Azure OpenAI On Your Data | Ja | |
Schlüssel | Zeichenfolge | Der für die Authentifizierung zu verwendende API-Schlüssel. | No |
onYourDataConnectionStringAuthenticationOptions
Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung einer Verbindungszeichenfolge
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | onYourDataAuthenticationType | Die unterstützten Authentifizierungstypen für Azure OpenAI On Your Data | Ja | |
connection_string | Zeichenfolge | Die Verbindungszeichenfolge für die Authentifizierung | No |
onYourDataKeyAndKeyIdAuthenticationOptions
Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung eines Schlüssel- und Schlüssel-ID-Paars von Elasticsearch.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | onYourDataAuthenticationType | Die unterstützten Authentifizierungstypen für Azure OpenAI On Your Data | Ja | |
Schlüssel | Zeichenfolge | Der für die Authentifizierung zu verwendende Elasticsearch-Schlüssel | No | |
key_id | Zeichenfolge | Die für die Authentifizierung zu verwendende Elasticsearch-Schlüssel-ID | No |
onYourDataEncodedApiKeyAuthenticationOptions
Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung eines elasticsearch-codierten API-Schlüssels
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | onYourDataAuthenticationType | Die unterstützten Authentifizierungstypen für Azure OpenAI On Your Data | Ja | |
encoded_api_key | Zeichenfolge | Der für die Authentifizierung zu verwendende elasticsearch-codierte API-Schlüssel | No |
onYourDataAccessTokenAuthenticationOptions
Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung von Zugriffstoken
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | onYourDataAuthenticationType | Die unterstützten Authentifizierungstypen für Azure OpenAI On Your Data | Ja | |
access_token | Zeichenfolge | Das Zugriffstoken zur Verwendung bei der Authentifizierung | No |
onYourDataSystemAssignedManagedIdentityAuthenticationOptions
Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung einer vom System zugewiesenen verwalteten Identität.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | onYourDataAuthenticationType | Die unterstützten Authentifizierungstypen für Azure OpenAI On Your Data | Ja |
onYourDataUserAssignedManagedIdentityAuthenticationOptions
Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung einer vom Benutzer zugewiesenen verwalteten Identität.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | onYourDataAuthenticationType | Die unterstützten Authentifizierungstypen für Azure OpenAI On Your Data | Ja | |
managed_identity_resource_id | Zeichenfolge | Die Ressourcen-ID der benutzerseitig zugewiesenen verwalteten Identität, die für die Authentifizierung verwendet werden soll. | No |
onYourDataUsernameAndPasswordAuthenticationOptions
Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung von Benutzername und Kennwort.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | onYourDataAuthenticationType | Die unterstützten Authentifizierungstypen für Azure OpenAI On Your Data | Ja | |
username | Zeichenfolge | Der Benutzername, der für die Authentifizierung verwendet wird. | No | |
Kennwort | Zeichenfolge | Das Kennwort. der für die Authentifizierung verwendet wird. | No |
onYourDataVectorizationSource
Eine abstrakte Darstellung einer Vektorisierungsquelle für Azure OpenAI On Your Data mit Vektorsuche
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | onYourDataVectorizationSourceType | Stellt die verfügbaren Quellen dar, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Verwendung mit der Vektorsuche zu konfigurieren |
Ja |
onYourDataVectorizationSourceType
Stellt die verfügbaren Quellen dar, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Verwendung mit der Vektorsuche zu konfigurieren
Beschreibung: Stellt die verfügbaren Quellen dar, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Verwendung mit
der Vektorsuche zu konfigurieren.
Typ: string
Standardwert:
Enumerationsname: OnYourDataVectorizationSourceType
Enumerationswerte:
Wert | Beschreibung |
---|---|
endpoint | Stellt die Vektorisierung dar, die von Aufrufen durchgeführt wird, die von öffentlichen Diensten an ein Azure OpenAI-Einbettungsmodell gerichtet werden |
deployment_name | Stellt den zu verwendenden Namen einer Ada-Modellimplementierung dar. Diese Modellimplementierung muss sich in der gleichen Azure OpenAI-Ressource befinden. On Your Data verwendet diese Modellimplementierung jedoch über einen internen Aufruf anstelle eines öffentlichen Aufrufs, was eine Vektorsuche auch in privaten Netzwerken ermöglicht. |
integriert | Stellt den integrierten Vektorizer dar, der in der Suchressource definiert ist. |
model_id | Stellt eine spezifische Einbettungsmodell-ID gemäß Definition im Suchdienst dar. Wird derzeit nur von Elasticsearch® unterstützt. |
onYourDataEndpointVectorizationSource
Die Details einer Vektorisierungsquelle, die von Azure OpenAI On Your Data beim Anwenden der Vektorsuche verwendet wird – basierend auf einem öffentlichen Azure OpenAI-Endpunktaufruf für Einbettungen.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | onYourDataVectorizationSourceType | Stellt die verfügbaren Quellen dar, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Verwendung mit der Vektorsuche zu konfigurieren |
Ja | |
endpoint | Zeichenfolge | Gibt die Ressourcenendpunkt-URL an, aus der Einbettungen abgerufen werden sollen. Sie sollte im Format https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings sein. Der Abfrageparameter der API-Version ist nicht zulässig. |
No | |
authentication | onYourDataApiKeyAuthenticationOptions oder onYourDataAccessTokenAuthenticationOptions | No | ||
Dimensionen | integer | Anzahl der Dimensionen, die die Einbettungen aufweisen sollten. Nur in text-embedding-3 und späteren Modellen unterstützt. |
No |
onYourDataDeploymentNameVectorizationSource
Die Details einer Vektorisierungsquelle, die von Azure OpenAI On Your Data beim Anwenden der Vektorsuche verwendet wird, die auf einem internen Namen der Modellimplementierung für Einbettungen in der gleichen Azure OpenAI-Ressource basiert.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | onYourDataVectorizationSourceType | Stellt die verfügbaren Quellen dar, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Verwendung mit der Vektorsuche zu konfigurieren |
Ja | |
deployment_name | Zeichenfolge | Gibt den Namen der Modellimplementierung an, die für die Vektorisierung verwendet werden soll. Diese Modellimplementierung muss sich in der gleichen Azure OpenAI-Ressource befinden. On Your Data verwendet diese Modellimplementierung jedoch über einen internen Aufruf anstelle eines öffentlichen Aufrufs, was eine Vektorsuche auch in privaten Netzwerken ermöglicht. | No | |
Dimensionen | integer | Anzahl der Dimensionen, die die Einbettungen aufweisen sollten. Nur in text-embedding-3 und späteren Modellen unterstützt. |
No |
onYourDataIntegratedVectorizationSource
Stellt den integrierten Vektorizer dar, der in der Suchressource definiert ist.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | onYourDataVectorizationSourceType | Stellt die verfügbaren Quellen dar, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Verwendung mit der Vektorsuche zu konfigurieren |
Ja |
onYourDataModelIdVectorizationSource
Die Details einer Vektorisierungsquelle, die von Azure OpenAI On Your Data beim Anwenden der Vektorsuche verwendet wird – basierend auf einer Suchdienstmodell-ID. Wird derzeit nur von Elasticsearch® unterstützt.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | onYourDataVectorizationSourceType | Stellt die verfügbaren Quellen dar, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Verwendung mit der Vektorsuche zu konfigurieren |
Ja | |
model_id | Zeichenfolge | Gibt die Modell-ID an, die für die Vektorisierung verwendet werden soll. Diese Modell-ID muss im Suchdienst definiert werden. | No |
azureChatExtensionsMessageContext
Eine Darstellung der zusätzlichen Kontextinformationen, die verfügbar sind, wenn Azure OpenAI-Chaterweiterungen an der Generierung einer entsprechenden Chatvervollständigungsantwort beteiligt sind. Diese Kontextinformationen werden nur aufgefüllt, wenn eine Azure OpenAI-Anforderung verwendet wird, die für die Verwendung einer passenden Erweiterung konfiguriert ist.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
citations | array | Das Ergebnis des Datenquellenabrufs, das zum Generieren der Assistentennachricht in der Antwort verwendet wird. | No | |
Absicht | Zeichenfolge | Die erkannte Absicht aus dem Chatverlauf, die für die Übergabe an den nächsten Durchlauf verwendet wird, um den Kontext zu übernehmen. | No | |
all_retrieved_documents | array | Alle abgerufenen Dokumente. | No |
citation
Zitatinformationen für eine Antwortnachricht für Chatvervollständigungen.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
content | Zeichenfolge | Der Inhalt des Zitats. | Ja | |
title | Zeichenfolge | Der Titel des Zitats. | No | |
url | Zeichenfolge | Die URL des Zitats. | No | |
filepath | Zeichenfolge | Der Dateipfad des Zitats. | No | |
chunk_id | Zeichenfolge | Die Segment-ID des Zitats. | No | |
rerank_score | Zahl | Die neue Rangpunktzahl des abgerufenen Dokuments. | No |
retrievedDocument
Das abgerufene Dokument.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
content | Zeichenfolge | Der Inhalt des Zitats. | Ja | |
title | Zeichenfolge | Der Titel des Zitats. | No | |
url | Zeichenfolge | Die URL des Zitats. | No | |
filepath | Zeichenfolge | Der Dateipfad des Zitats. | No | |
chunk_id | Zeichenfolge | Die Segment-ID des Zitats. | No | |
rerank_score | Zahl | Die neue Rangpunktzahl des abgerufenen Dokuments. | No | |
search_queries | array | Die zum Abrufen des Dokuments verwendeten Suchabfragen. | No | |
data_source_index | integer | Der Index der Datenquelle. | No | |
original_search_score | Zahl | Die ursprüngliche Suchbewertung des abgerufenen Dokuments. | No | |
filter_reason | filterReason | Der Filtergrund für das abgerufene Dokument. | No |
filterReason
Der Filtergrund für das abgerufene Dokument.
Beschreibung: Der Filtergrund für das abgerufene Dokument.
Typ: string
Standardwert:
Enumerationsname: FilterReason
Enumerationswerte:
Wert | Beschreibung |
---|---|
Ergebnis Ihrer App | Das Dokument wird nach dem Schwellenwert der ursprünglichen Suchbewertung gefiltert, der durch die Konfiguration von strictness definiert ist. |
rerank | Das Dokument wird nicht nach dem Schwellenwert der ursprünglichen Suchbewertung, sondern nach dem Neubewertungswert und der Konfiguration von top_n_documents gefiltert. |
chatCompletionMessageToolCall
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Die ID des Toolaufrufs | Ja | |
Typ | toolCallType | Der Typ des Toolaufrufs (in diesem Fall: function ). |
Ja | |
Funktion | Objekt | Die Funktion, die das Modell aufgerufen hat | Ja |
Eigenschaften für „function“
name
Name | Typ | Beschreibung | Standard |
---|---|---|---|
name | Zeichenfolge | Der Name der aufzurufenden Funktion. |
Argumente
Name | Typ | Beschreibung | Standard |
---|---|---|---|
Argumente | Zeichenfolge | Die Argumente, mit denen die Funktion aufgerufen werden soll, wie sie vom Modell im JSON-Format generiert werden. Beachten Sie, dass das Modell nicht immer gültige JSON-Werte und möglicherweise Parameter generiert, die nicht durch Ihr Funktionsschema definiert sind. Überprüfen Sie die Argumente im Code, bevor Sie Ihre Funktion aufrufen. |
toolCallType
Der Typ des Toolaufrufs (in diesem Fall: function
).
Beschreibung: Der Typ des Toolaufrufs (in diesem Fall: function
)
Typ: string
Standardwert:
Enumerationsname: ToolCallType
Enumerationswerte:
Wert | BESCHREIBUNG |
---|---|
Funktion | Der Typ des Toolaufrufs ist „function“. |
chatCompletionRequestMessageTool
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
tool_call_id | Zeichenfolge | Toolaufruf, auf den diese Nachricht reagiert. | No | |
content | Zeichenfolge | Der Inhalt der Nachricht. | No |
chatCompletionRequestMessageFunction
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
role | enum | Die Rolle des Nachrichtenerstellers (in diesem Fall: function ).Mögliche Werte: function |
No | |
name | Zeichenfolge | Der Inhalt der Nachricht. | No | |
content | Zeichenfolge | Der Inhalt der Nachricht. | No |
createChatCompletionResponse
Repräsentiert eine Chatvervollständigungsnachricht, die vom Modell basierend auf der Eingabe zurückgegeben wird.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Ein eindeutiger Bezeichner für die Chatvervollständigung | Ja | |
prompt_filter_results | promptFilterResults | Ergebnisse der Inhaltsfilterung für null oder mehr Prompts in der Anforderung. Bei einer Streaminganforderung können Ergebnisse für unterschiedliche Prompts zu unterschiedlichen Zeiten oder in unterschiedlicher Reihenfolge eingehen. | No | |
Optionen | array | Eine Liste der Auswahlmöglichkeiten für den Chatabschluss. Es können mehrere sein, wenn n größer als 1 ist. |
Ja | |
erstellte | integer | Der Unix-Zeitstempel (in Sekunden) des Zeitpunkts, zu dem die Chatvervollständigung erstellt wurde | Ja | |
Modell | Zeichenfolge | Das Modell, das für die Chatvervollständigung verwendet wird | Ja | |
system_fingerprint | Zeichenfolge | Dieser Fingerabdruck stellt die Back-End-Konfiguration dar, mit der das Modell ausgeführt wird. Kann zusammen mit dem Anforderungsparameter seed verwendet werden, um zu verstehen, wann Back-End-Änderungen vorgenommen wurden, die sich auf den Determinismus auswirken können. |
No | |
Objekt | enum | Der Objekttyp, der immer chat.completion ist.Mögliche Werte: chat.completion |
Ja | |
Nutzung | completionUsage | Nutzungsstatistiken für die Vervollständigungsanforderung | No |
createChatCompletionStreamResponse
Repräsentiert einen gestreamten Block einer Chatvervollständigungsnachricht, die vom Modell basierend auf der Eingabe zurückgegeben wird.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Ein eindeutiger Bezeichner für die Chatvervollständigung Jeder Block weist die gleiche ID auf. | Ja | |
Optionen | array | Eine Liste der Auswahlmöglichkeiten für den Chatabschluss. Kann mehrere Elemente enthalten, wenn n größer als 1 ist. |
Ja | |
erstellte | integer | Der Unix-Zeitstempel (in Sekunden) des Zeitpunkts, zu dem die Chatvervollständigung erstellt wurde Alle Blöcke weisen den gleichen Zeitstempel auf. | Ja | |
Modell | Zeichenfolge | Das Modell, das die Vervollständigung generiert. | Ja | |
system_fingerprint | Zeichenfolge | Dieser Fingerabdruck stellt die Back-End-Konfiguration dar, mit der das Modell ausgeführt wird. Kann zusammen mit dem Anforderungsparameter seed verwendet werden, um zu verstehen, wann Back-End-Änderungen vorgenommen wurden, die sich auf den Determinismus auswirken können. |
No | |
Objekt | enum | Der Objekttyp, der immer chat.completion.chunk ist.Mögliche Werte: chat.completion.chunk |
Ja |
chatCompletionStreamResponseDelta
Ein Chat-Vervollständigungsdelta, das von gestreamten Modellantworten generiert wurde.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
content | Zeichenfolge | Die Inhalte der Blocknachricht. | No | |
function_call | Objekt | Veraltet und durch tool_calls ersetzt. Der Name und die Argumente einer Funktion, die aufgerufen werden soll, wie sie vom Modell generiert werden. |
No | |
tool_calls | array | No | ||
role | enum | Die Rolle des Autors dieser Nachricht Mögliche Werte: system, user, assistant, tool |
No | |
Ablehnung | Zeichenfolge | Eine vom Modell generierte Ablehnungsmeldung. | No |
Eigenschaften für function_call
Argumente
Name | Typ | Beschreibung | Standard |
---|---|---|---|
Argumente | Zeichenfolge | Die Argumente, mit denen die Funktion aufgerufen werden soll, wie sie vom Modell im JSON-Format generiert werden. Beachten Sie, dass das Modell nicht immer gültige JSON-Werte und möglicherweise Parameter generiert, die nicht durch Ihr Funktionsschema definiert sind. Überprüfen Sie die Argumente im Code, bevor Sie Ihre Funktion aufrufen. |
name
Name | Typ | Beschreibung | Standard |
---|---|---|---|
name | Zeichenfolge | Der Name der aufzurufenden Funktion. |
chatCompletionMessageToolCallChunk
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Index | integer | Ja | ||
id | Zeichenfolge | Die ID des Toolaufrufs | No | |
Typ | enum | Der Typ des Tools. Derzeit wird nur function unterstützt.Mögliche Werte: function |
No | |
Funktion | Objekt | No |
Eigenschaften für „function“
name
Name | Typ | Beschreibung | Standard |
---|---|---|---|
name | Zeichenfolge | Der Name der aufzurufenden Funktion. |
Argumente
Name | Typ | Beschreibung | Standard |
---|---|---|---|
Argumente | Zeichenfolge | Die Argumente, mit denen die Funktion aufgerufen werden soll, wie sie vom Modell im JSON-Format generiert werden. Beachten Sie, dass das Modell nicht immer gültige JSON-Werte und möglicherweise Parameter generiert, die nicht durch Ihr Funktionsschema definiert sind. Überprüfen Sie die Argumente im Code, bevor Sie Ihre Funktion aufrufen. |
chatCompletionStreamOptions
Optionen für eine Streamingantwort. Legen Sie dies nur fest, wenn Sie stream: true
festlegen.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
include_usage | boolean | Wenn dies festgelegt ist, wird ein zusätzlicher Block vor der data: [DONE] -Nachricht gestreamt. Das Feld usage in diesem Block zeigt die Tokenverwendungsstatistiken für die gesamte Anforderung an, und das Feld choices ist immer ein leeres Array. Alle anderen Blöcke enthalten auch ein Feld usage , jedoch mit einem NULL-Wert. |
No |
chatCompletionChoiceLogProbs
Logarithmierte Wahrscheinlichkeit für die Auswahl
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
content | array | Eine Liste der Nachrichteninhaltstoken mit Informationen zur logarithmierten Wahrscheinlichkeit | Ja | |
Ablehnung | array | Eine Liste der Nachrichtenablehnungstoken mit Informationen zur logarithmierten Wahrscheinlichkeit. | No |
chatCompletionTokenLogprob
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
token | Zeichenfolge | Das Token. | Ja | |
logprob | Zahl | Die logarithmierte Wahrscheinlichkeit dieses Tokens | Ja | |
Byte | array | Eine Liste mit ganzen Zahlen, die die UTF-8-Bytedarstellung des Tokens darstellen. Nützlich in Fällen, in denen Zeichen durch mehrere Token dargestellt werden und ihre Bytedarstellungen kombiniert werden müssen, um die korrekte Textdarstellung zu generieren. Kann null sein, wenn für das Token keine Bytedarstellung vorhanden ist. |
Ja | |
top_logprobs | array | Liste mit den wahrscheinlichsten Token und ihre logarithmierte Wahrscheinlichkeit an dieser Tokenposition. In seltenen Fällen werden möglicherweise weniger zurückgegeben als für top_logprobs angefordert. |
Ja |
ChatCompletionResponseMessage
Eine vom Modell generierte Chatvervollständigungsnachricht
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
role | chatCompletionResponseMessageRole | Die Rolle des Antwortnachrichterstellers | Ja | |
Ablehnung | Zeichenfolge | Eine vom Modell generierte Ablehnungsmeldung. | Ja | |
content | Zeichenfolge | Der Inhalt der Nachricht. | Ja | |
tool_calls | array | Die vom Modell generierten Toolaufrufe, z. B. Funktionsaufrufe. | No | |
function_call | chatCompletionFunctionCall | Veraltet und durch tool_calls ersetzt. Der Name und die Argumente einer Funktion, die aufgerufen werden soll, wie sie vom Modell generiert werden. |
No | |
context | azureChatExtensionsMessageContext | Eine Darstellung der zusätzlichen Kontextinformationen, die verfügbar sind, wenn Azure OpenAI-Chaterweiterungen an der Generierung einer entsprechenden Chatvervollständigungsantwort beteiligt sind. Diese Kontextinformationen werden nur ausgefüllt, wenn eine Azure OpenAI-Anforderung verwendet wird, die für die Verwendung einer entsprechenden Erweiterung konfiguriert ist. |
No |
chatCompletionResponseMessageRole
Die Rolle des Antwortnachrichterstellers
Beschreibung: Die Rolle des Autors der Antwortnachricht
Typ: string
Standardwert:
Enumerationswerte:
- assistant
chatCompletionToolChoiceOption
Steuert, welches Tool (falls vorhanden) vom Modell aufgerufen wird. none
bedeutet, dass das Modell keine Tools aufruft und stattdessen eine Meldung generiert. auto
bedeutet, dass das Modell zwischen dem Generieren einer Meldung und dem Aufrufen von Tools wählen kann. required
bedeutet, dass das Modell mindestens ein Tool aufrufen muss. Wenn Sie mit {"type": "function", "function": {"name": "my_function"}}
ein bestimmtes Tool angeben, wird das Modell gezwungen, dieses aufzurufen. none
ist die Standardeinstellung, wenn keine Tools vorhanden sind. auto
ist die Standardeinstellung, wenn Tools vorhanden sind.
Mögliche Werte für diese Komponente:
chatCompletionNamedToolChoice
Gibt ein Tool an, das das Modell verwenden soll. Wird verwendet, um zu erzwingen, dass das Modell eine bestimmte Funktion aufruft.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | enum | Der Typ des Tools. Derzeit wird nur function unterstützt.Mögliche Werte: function |
Ja | |
Funktion | Objekt | Ja |
Eigenschaften für „function“
name
Name | Typ | Beschreibung | Standard |
---|---|---|---|
name | Zeichenfolge | Der Name der aufzurufenden Funktion. |
ParallelToolCalls
Gibt an, ob beim Verwenden des Tools parallele Funktionsaufrufe aktiviert werden sollen.
Für diese Komponente sind keine Eigenschaften definiert.
chatCompletionMessageToolCalls
Die vom Modell generierten Toolaufrufe, z. B. Funktionsaufrufe.
Für diese Komponente sind keine Eigenschaften definiert.
chatCompletionFunctionCall
Veraltet und durch tool_calls
ersetzt. Der Name und die Argumente einer Funktion, die aufgerufen werden soll, wie sie vom Modell generiert werden.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
name | Zeichenfolge | Der Name der aufzurufenden Funktion. | Ja | |
Argumente | Zeichenfolge | Die Argumente, mit denen die Funktion aufgerufen werden soll, wie sie vom Modell im JSON-Format generiert werden. Beachten Sie, dass das Modell nicht immer gültige JSON-Werte und möglicherweise Parameter generiert, die nicht durch Ihr Funktionsschema definiert sind. Überprüfen Sie die Argumente im Code, bevor Sie Ihre Funktion aufrufen. | Ja |
completionUsage
Nutzungsstatistiken für die Vervollständigungsanforderung
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
prompt_tokens | integer | Anzahl der Token im Prompt. | Ja | |
completion_tokens | integer | Anzahl der Token in der generierten Vervollständigung | Ja | |
total_tokens | integer | Die Gesamtzahl der in der Anforderung verwendeten Token (Prompt + Vervollständigung). | Ja | |
prompt_tokens_details | Objekt | Details der Prompttoken. | No | |
completion_tokens_details | Objekt | Aufschlüsselung der in einer Vervollständigung verwendeten Tokens. | No |
Eigenschaften für prompt_tokens_details
cached_tokens
Name | Typ | Beschreibung | Standard |
---|---|---|---|
cached_tokens | integer | Die Anzahl der zwischengespeicherten Prompttoken. |
Eigenschaften für completion_tokens_details
reasoning_tokens
Name | Typ | Beschreibung | Standard |
---|---|---|---|
reasoning_tokens | integer | Vom Modell generierte Tokens zur Begründung. |
chatCompletionTool
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | enum | Der Typ des Tools. Derzeit wird nur function unterstützt.Mögliche Werte: function |
Ja | |
Funktion | FunctionObject | Ja |
FunctionParameters
Die von den Funktionen akzeptierten Parameter beschrieben als JSON-Schemaobjekt. Beispiele finden Sie in der Anleitung](https://learn.microsoft.com/azure/ai-services/openai/how-to/function-calling) und die Dokumentation zum Format in der JSON-Schemareferenz.
Wenn parameters
weggelassen wird, wird eine Funktion mit einer leeren Parameterliste definiert.
Für diese Komponente sind keine Eigenschaften definiert.
FunctionObject
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Beschreibung | string | Eine Beschreibung des Zwecks der Funktion, die vom Modell verwendet wird, um auszuwählen, wann und wie die Funktion aufgerufen wird. | No | |
name | Zeichenfolge | Der Name der Funktion, die aufgerufen werden soll. Muss aus a–z, A–Z, 0–9 bestehen oder Unterstriche und Bindestriche enthalten, maximale Länge: 64. | Ja | |
Parameter | FunctionParameters | Die von den Funktionen akzeptierten Parameter beschrieben als JSON-Schemaobjekt. Beispiele finden Sie in der Anleitung](https://learn.microsoft.com/azure/ai-services/openai/how-to/function-calling) und die Dokumentation zum Format in der JSON-Schemareferenz. Wenn parameters weggelassen wird, wird eine Funktion mit einer leeren Parameterliste definiert. |
No | |
strict | boolean | Gibt an, ob die strikte Schematreue beim Generieren des Funktionsaufrufs aktiviert werden soll. Wenn dieser Wert auf „true“ festgelegt ist, folgt das Modell dem genauen Schema, das im Feld parameters definiert ist. Nur eine Teilmenge des JSON-Schemas wird unterstützt, wenn strict true ist. |
No | False |
ResponseFormatText
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | enum | Der Typ des zu definierenden Antwortformats: text Mögliche Werte: text |
Ja |
ResponseFormatJsonObject
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | enum | Der Typ des zu definierenden Antwortformats: json_object Mögliche Werte: json_object |
Ja |
ResponseFormatJsonSchemaSchema
Das Schema für das Antwortformat, das als JSON-Schemaobjekt beschrieben wird.
Für diese Komponente sind keine Eigenschaften definiert.
ResponseFormatJsonSchema
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | enum | Der Typ des zu definierenden Antwortformats: json_schema Mögliche Werte: json_schema |
Ja | |
json_schema | Objekt | Ja |
Eigenschaften für json_schema
Beschreibung
Name | Typ | Beschreibung | Default |
---|---|---|---|
Beschreibung | string | Eine Beschreibung, wofür das Antwortformat gedacht ist, die vom Modell verwendet wird, um zu bestimmen, wie in dem Format geantwortet werden soll. |
name
Name | Typ | Beschreibung | Standard |
---|---|---|---|
name | Zeichenfolge | Der Name des Antwortformats. Muss aus a–z, A–Z, 0–9 bestehen oder Unterstriche und Bindestriche enthalten, maximale Länge: 64. |
schema
Name | Typ | Beschreibung | Standard |
---|---|---|---|
schema | ResponseFormatJsonSchemaSchema | Das Schema für das Antwortformat, das als JSON-Schemaobjekt beschrieben wird. |
strict
Name | Typ | Beschreibung | Standard |
---|---|---|---|
strict | boolean | Gibt an, ob die strikte Schematreue beim Generieren der Ausgabe aktiviert werden soll. Wenn dieser Wert auf „true“ festgelegt ist, folgt das Modell immer dem genauen Schema, das im Feld schema definiert ist. Nur eine Teilmenge des JSON-Schemas wird unterstützt, wenn strict true ist. |
False |
chatCompletionChoiceCommon
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Index | integer | No | ||
finish_reason | Zeichenfolge | No |
createTranslationRequest
Übersetzungsanforderung
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
datei | Zeichenfolge | Die zu übersetzende Audiodatei | Ja | |
prompt | Zeichenfolge | Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt muss in englischer Sprache formuliert werden. | No | |
response_format | audioResponseFormat | Definiert das Format der Ausgabe | No | |
Temperatur | Zahl | Die Temperatur für die Stichprobenentnahme, zwischen 0 und 1. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. Wenn dieser Wert auf „0“ festgelegt wird, verwendet das Modell die logarithmierte Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht werden. | No | 0 |
audioResponse
Übersetzungs- oder Transkriptionsantwort, wenn das Antwortformat (response_format) „json“ war
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Text | Zeichenfolge | Übersetzter oder transkribierter Text | Ja |
audioVerboseResponse
Übersetzungs- oder Transkriptionsantwort, wenn das Antwortformat (response_format) „verbose_json“ war
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Text | Zeichenfolge | Übersetzter oder transkribierter Text | Ja | |
task | Zeichenfolge | Die Art von Audiotask | No | |
language | Zeichenfolge | Sprache. | No | |
duration | Zahl | Dauer. | No | |
Segmente | array | No | ||
words | array | No |
audioResponseFormat
Definiert das Format der Ausgabe
Beschreibung: Definiert das Format der Ausgabe
Typ: string
Standardwert:
Enumerationswerte:
- json
- Text
- srt
- verbose_json
- vtt
createTranscriptionRequest
Transkriptionsanforderung
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
datei | Zeichenfolge | Das zu transkribierende Audiodateiobjekt | Ja | |
prompt | Zeichenfolge | Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Die Äußerung sollte mit der Audiosprache übereinstimmen. | No | |
response_format | audioResponseFormat | Definiert das Format der Ausgabe | No | |
Temperatur | Zahl | Die Temperatur für die Stichprobenentnahme, zwischen 0 und 1. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. Wenn dieser Wert auf „0“ festgelegt wird, verwendet das Modell die logarithmierte Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht werden. | No | 0 |
language | Zeichenfolge | Die Sprache der Audioeingabe. Die Bereitstellung der Eingabesprache im ISO-639-1-Format verbessert die Genauigkeit und verkürzt die Wartezeit. | No | |
timestamp_granularities[] | array | Die Zeitstempel-Granularitäten, die für diese Transkription ausgefüllt werden sollen. response_format muss auf verbose_json festgelegt werden, um die Zeitstempel-Granularitäten zu verwenden. Eine oder beide dieser Optionen werden unterstützt: word oder segment . Hinweis: Durch Segmentzeitstempel entsteht keine zusätzliche Wartezeit, aber das Generieren von Wortzeitstempeln führt zu zusätzlicher Wartezeit. |
No | ['segment'] |
audioSegment
Transkriptions- oder Übersetzungssegment
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | integer | Segmentbezeichner | No | |
seek | Zahl | Der Offset des Segments | No | |
start | Zahl | Der Offset für den Segmentbeginn. | No | |
end | Zahl | Der Offset für das Segmentende | No | |
Text | Zeichenfolge | Segmenttext | No | |
tokens | array | Token des Texts | No | |
Temperatur | Zahl | Temperatur | No | |
avg_logprob | Zahl | Durchschnittliche logarithmierte Wahrscheinlichkeit | No | |
compression_ratio | Zahl | Komprimierungsverhältnis | No | |
no_speech_prob | Zahl | Wahrscheinlichkeit von „keine Sprache“ | No |
audioWord
Transkriptions- oder Übersetzungswort.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
word | Zeichenfolge | Word | No | |
start | Zahl | Der Offset für den Wortbeginn. | No | |
end | Zahl | Der Offset für das Wortende. | No |
createSpeechRequest
Sprachanforderung
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
input | Zeichenfolge | Der Text, für den Audio synthetisiert werden soll. Die maximale Länge beträgt 4.096 Zeichen. | Ja | |
voice | enum | Die Stimme, die für die Sprachsynthese verwendet werden soll. Mögliche Werte: alloy, echo, fable, onyx, nova, shimmer |
Ja | |
response_format | enum | Das Format für die Audiosynthetisierung. Mögliche Werte: mp3, opus, aac, flac, wav, pcm |
No | |
Geschwindigkeit | Zahl | Die Geschwindigkeit des synthetisierten Audios. Wählen Sie einen Wert von 0.25 bis 4.0 aus. 1.0 ist die Standardoption. |
No | 1.0 |
imageQuality
Die Qualität des zu generierenden Bilds
Beschreibung: Die Qualität des zu generierenden Bilds
Typ: string
Standard: standard
Enumerationsname: Quality
Enumerationswerte:
Wert | BESCHREIBUNG |
---|---|
Standard | Bei Verwendung von Standardqualität werden Bilder mit Standardqualität erstellt. |
hd | Bei Verwendung von HD-Qualität werden Bilder mit mehr Details und höherer Konsistenz im gesamten Bild erstellt. |
imagesResponseFormat
Das Format, in dem die generierten Bilder zurückgegeben werden.
Beschreibung: Das Format, in dem die generierten Bilder zurückgegeben werden
Typ: string
Standard: url
Enumerationsname: ImagesResponseFormat
Enumerationswerte:
Wert | Beschreibung |
---|---|
url | Die URL für temporären Zugriff zum Herunterladen der generierten Bilder |
b64_json | Die generierten Bilder werden als base64-codierte Zeichenfolge zurückgegeben. |
imageSize
Die Größe der generierten Bilder.
Beschreibung: Die Größe der generierten Bilder
Typ: string
Standard: 1024x1024
Enumerationsname: Size
Enumerationswerte:
Wert | Beschreibung |
---|---|
256x256 | Die gewünschte Größe des generierten Bilds beträgt 256 × 256 Pixel. Wird nur für DALL-E 2 unterstützt. |
512 × 512 | Die gewünschte Größe des generierten Bilds beträgt 512 × 512 Pixel. Wird nur für DALL-E 2 unterstützt. |
1792x1024 | Die gewünschte Größe des generierten Bilds beträgt 1.792 × 1.024 Pixel. Wird nur für DALL-E 3 unterstützt. |
1024x1792 | Die gewünschte Größe des generierten Bilds beträgt 1.024 × 1.792 Pixel. Wird nur für DALL-E 3 unterstützt. |
1\.024 × 1.024 | Die gewünschte Größe des generierten Bilds beträgt 1.024 × 1.024 Pixel. |
imageStyle
Die Größe der generierten Bilder.
Beschreibung: Der Stil der generierten Bilder
Typ: string
Standard: vivid
Enumerationsname: Style
Enumerationswerte:
Wert | Beschreibung |
---|---|
vivid | Mit „vivid“ werden hyperrealistische und spektakuläre Bilder erstellt. |
natural | Mit „natural“ werden natürlichere und weniger hyperrealistische Bilder erstellt. |
imageGenerationsRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
prompt | Zeichenfolge | Eine Textbeschreibung der gewünschten Bilder. Die maximale Länge beträgt 4.000 Zeichen. | Ja | |
n | integer | Die Anzahl der zu generierenden Bilder. | No | 1 |
size | imageSize | Die Größe der generierten Bilder. | No | 1\.024 × 1.024 |
response_format | imagesResponseFormat | Das Format, in dem die generierten Bilder zurückgegeben werden. | No | url |
user | Zeichenfolge | Ein eindeutiger Bezeichner, der Ihr Endbenutzerkonto darstellt und bei der Überwachung und Erkennung von Missbrauch helfen kann. | No | |
qualität | imageQuality | Die Qualität des zu generierenden Bilds | No | Standard |
style | imageStyle | Die Größe der generierten Bilder. | No | vivid |
generateImagesResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
erstellte | integer | Der UNIX-Zeitstempel, der angibt, wann der Vorgang erstellt wurde | Ja | |
data | array | Die Ergebnisdaten des Vorgangs, sofern der Vorgang erfolgreich war | Ja |
imageResult
Die Bild-URL oder das codierte Bild, sofern der Vorgang erfolgreich war. Andernfalls ein Fehler.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
url | Zeichenfolge | Die Bild-URL | No | |
b64_json | Zeichenfolge | Das base64-codierte Bild | No | |
content_filter_results | dalleContentFilterResults | Informationen zu den Ergebnissen der Inhaltsfilterung | No | |
revised_prompt | Zeichenfolge | Der Prompt, der zum Generieren des Bilds verwendet wurde, wenn der Prompts überarbeitet wurde | No | |
prompt_filter_results | dalleFilterResults | Informationen zur Inhaltsfilterkategorie („hate“, „sexual“, „violence“, „self_harm“), sofern sie erkannt wurde, und zum Schweregrad („very_low“, „low“, „medium“, „high-scale“, um die Intensität und Risikostufe schädlicher Inhalte zu bestimmen) sowie dazu, ob der Inhalt gefiltert wurde. Informationen zu Jailbreak-Inhalten und Profanität, sofern diese erkannt wurden, sowie dazu, ob der Inhalt gefiltert wurde. Außerdem Informationen zur Kundenblockliste, wenn diese gefiltert wurde, und ihre ID. | No |
line
Ein Inhaltszeilenobjekt, bestehend aus einer zusammenhängenden Sequenz von Inhaltselementen (z. B. Wörter und Auswahlmarkierungen).
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Text | Zeichenfolge | Ja | ||
spans | array | Ein Array von span-Objekten, die erkannte Objekte und die zugehörigen Angaben zum umgebenden Rechteck darstellen. | Ja |
span
Ein span-Objekt, das ein erkanntes Objekt und die zugehörigen Angaben zum umgebenden Rechteck darstellt.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Text | Zeichenfolge | Der Textinhalt des span-Objekts, das das erkannte Objekt darstellt. | Ja | |
offset | integer | Der Zeichenoffset innerhalb des Texts, der angibt, wo das span-Objekt beginnt. Dieser Offset ist als die Position des ersten Zeichens des span-Objekts definiert. Gezählt wird dabei vom Anfang des Texts in Unicode-Codepunkten. | Ja | |
length | integer | Die Länge des span-Objekts in Zeichen, gemessen in Unicode-Codepunkten. | Ja | |
polygon | array | Ein Array von Objekten, die Punkte in dem Polygon darstellen, das das erkannte Objekt umschließt. | Ja |
runCompletionUsage
Verwendungsstatistiken im Zusammenhang mit der Ausführung. Dieser Wert ist null
, wenn sich die Ausführung nicht in einem Endzustand (d. h. in_progress
, queued
usw.) befindet.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
completion_tokens | integer | Die Anzahl von Vervollständigungstoken, die im Laufe der Ausführung verwendet wurden. | Ja | |
prompt_tokens | integer | Die Anzahl von Prompttoken, die im Laufe der Ausführung verwendet wurden. | Ja | |
total_tokens | integer | Die Gesamtzahl verwendeter Token (Prompttoken + Vervollständigungstoken). | Ja |
runStepCompletionUsage
Verwendungsstatistik im Zusammenhang mit dem Ausführungsschritt. Dieser Wert ist null
, solange der Ausführungsschritt den Status in_progress
hat.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
completion_tokens | integer | Die Anzahl von Vervollständigungstoken, die im Laufe des Ausführungsschritts verwendet wurden. | Ja | |
prompt_tokens | integer | Die Anzahl von Prompttoken, die im Laufe des Ausführungsschritts verwendet wurden. | Ja | |
total_tokens | integer | Die Gesamtzahl verwendeter Token (Prompttoken + Vervollständigungstoken). | Ja |
assistantsApiResponseFormatOption
Gibt das Format an, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106
.
Das Festlegen auf { "type": "json_schema", "json_schema": {...} }
stellt strukturierte Ausgaben, die garantieren, dass das Modell Ihrem bereitgestellten JSON-Schema entspricht, sicher. Weitere Informationen finden Sie in der Anleitung „Strukturierte Ausgaben“.
Das Festlegen auf { "type": "json_object" }
aktiviert den JSON-Modus, der sicherstellt, dass die vom Modells generierte Meldung gültiger JSON-Code ist.
Wichtig: Wenn Sie den JSON-Modus verwenden, müssen Sie selbst das Modell auch über eine System- oder Benutzernachricht anweisen, JSON-Code zu erzeugen. Andernfalls generiert das Modell möglicherweise einen unendlichen Leerzeichenstrom, bis der Tokengrenzwert erreicht wird. Dies kann zu einer lange ausgeführten und scheinbar „hängenden“ Anforderung führen. Beachten Sie auch, dass der Meldungsinhalt teilweise abgeschnitten werden kann, wenn Sie finish_reason="length"
verwenden. Damit wird angegeben, dass bei der Generierung max_tokens
überschritten wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.
Mögliche Werte für diese Komponente:
assistantsApiResponseFormat
Ein Objekt, das die erwartete Ausgabe des Modells beschreibt. Bei json_object
darf nur der function
-Typ tools
an die Ausführung übergeben werden. Bei text
kann das Modell Text oder einen beliebigen benötigten Wert zurückgeben.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Muss text oder json_object sein. |
No | Text |
Typenumeration: AssistantsApiResponseFormat
Wert | Beschreibung |
---|---|
Text | |
json_object |
assistantObject
Stellt einen Assistenten (assistant
) dar, der das Modell aufrufen und Tools verwenden kann.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Der Bezeichner, auf den in API-Endpunkten verwiesen werden kann | Ja | |
Objekt | Zeichenfolge | Der Objekttyp, der immer assistant ist. |
Ja | |
created_at | integer | Der Unix-Zeitstempel (in Sekunden) des Zeitpunkts, zu dem der Assistent erstellt wurde. | Yes | |
Name | Zeichenfolge | Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen. |
Ja | |
description | string | Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen. |
Ja | |
Modell | Zeichenfolge | Die ID des zu verwendenden Modells. Sie können die API zum Auflisten von Modellen verwenden, um alle verfügbaren Modelle anzuzeigen, oder unsere Modellübersicht für Beschreibungen dieser Modelle anzeigen. |
Ja | |
Setup | Zeichenfolge | Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 256,000 Zeichen. |
Ja | |
tools | array | Eine Liste der im Assistenten aktivierten Tools. Jeder Assistent kann maximal 128 Tools enthalten. Tools können vom Typ code_interpreter , file_search oder function sein. |
Ja | [] |
tool_resources | Objekt | Eine Reihe von Ressourcen, die von den Tools des Assistenten verwendet werden. Die Ressourcen sind spezifisch für den Tooltyp. Beispielsweise erfordert das Tool code_interpreter eine Liste mit Datei-IDs, während das Tool file_search eine Liste mit Vektorspeicher-IDs erfordert. |
No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
Ja | |
Temperatur | Zahl | Die zu verwendende Temperatur für die Stichprobenentnahme zwischen 0 und 2. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. |
No | 1 |
top_p | Zahl | Eine Alternative zur Stichprobenentnahme mit Temperatur, die sogenannte Kernstichprobenentnahme (Nucleus Sampling), bei dem das Modell die Ergebnisse der Token mit der Wahrscheinlichkeitsmasse „top_p“ berücksichtigt. Daher bedeutet 0,1, dass nur die Token berücksichtigt werden, die die oberen 10 % der Wahrscheinlichkeitsmasse umfassen. Wir empfehlen im Allgemeinen, dies oder die Temperatur zu ändern, aber nicht beides. |
No | 1 |
response_format | assistantsApiResponseFormatOption | Gibt das Format an, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106 .Das Festlegen auf { "type": "json_schema", "json_schema": {...} } stellt strukturierte Ausgaben, die garantieren, dass das Modell Ihrem bereitgestellten JSON-Schema entspricht, sicher. Weitere Informationen finden Sie in der Anleitung „Strukturierte Ausgaben“.Das Festlegen auf { "type": "json_object" } aktiviert den JSON-Modus, der sicherstellt, dass die vom Modells generierte Meldung gültiger JSON-Code ist.Wichtig: Wenn Sie den JSON-Modus verwenden, müssen Sie selbst das Modell auch über eine System- oder Benutzernachricht anweisen, JSON-Code zu erzeugen. Andernfalls generiert das Modell möglicherweise einen unendlichen Leerzeichenstrom, bis der Tokengrenzwert erreicht wird. Dies kann zu einer lange ausgeführten und scheinbar „hängenden“ Anforderung führen. Beachten Sie auch, dass der Meldungsinhalt teilweise abgeschnitten werden kann, wenn Sie finish_reason="length" verwenden. Damit wird angegeben, dass bei der Generierung max_tokens überschritten wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat. |
No |
Eigenschaften für „tool_resources“
code_interpreter
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_ids | array | Eine Liste mit Datei-IDs, die für das Tool code_interpreter zur Verfügung gestellt wurden. Dem Tool können maximal 20 Dateien zugeordnet sein. |
[] |
file_search
Name | Typ | Beschreibung | Standard |
---|---|---|---|
vector_store_ids | array | Die ID des an diesen Assistenten angefügten Vektorspeichers. An den Assistenten kann maximal ein Vektorspeicher angefügt werden. |
Objektenumeration: AssistantObjectType
Wert | Beschreibung |
---|---|
assistant | Der Objekttyp (immer „assistant“). |
createAssistantRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
model | Yes | |||
Name | Zeichenfolge | Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen. |
No | |
Beschreibung | string | Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen. |
No | |
Setup | Zeichenfolge | Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 256,000 Zeichen. |
No | |
tools | array | Eine Liste der im Assistenten aktivierten Tools. Jeder Assistent kann maximal 128 Tools enthalten. Tools können vom Typ code_interpreter , retrieval oder function sein. |
No | [] |
tool_resources | Objekt | Eine Reihe von Ressourcen, die von den Tools des Assistenten verwendet werden. Die Ressourcen sind spezifisch für den Tooltyp. Beispielsweise erfordert das Tool code_interpreter eine Liste mit Datei-IDs, während das Tool file_search eine Liste mit Vektorspeicher-IDs erfordert. |
No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No | |
Temperatur | Zahl | Die zu verwendende Temperatur für die Stichprobenentnahme zwischen 0 und 2. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. |
No | 1 |
top_p | Zahl | Eine Alternative zur Stichprobenentnahme mit Temperatur, die sogenannte Kernstichprobenentnahme (Nucleus Sampling), bei dem das Modell die Ergebnisse der Token mit der Wahrscheinlichkeitsmasse „top_p“ berücksichtigt. Daher bedeutet 0,1, dass nur die Token berücksichtigt werden, die die oberen 10 % der Wahrscheinlichkeitsmasse umfassen. Wir empfehlen im Allgemeinen, dies oder die Temperatur zu ändern, aber nicht beides. |
No | 1 |
response_format | assistantsApiResponseFormatOption | Gibt das Format an, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106 .Das Festlegen auf { "type": "json_schema", "json_schema": {...} } stellt strukturierte Ausgaben, die garantieren, dass das Modell Ihrem bereitgestellten JSON-Schema entspricht, sicher. Weitere Informationen finden Sie in der Anleitung „Strukturierte Ausgaben“.Das Festlegen auf { "type": "json_object" } aktiviert den JSON-Modus, der sicherstellt, dass die vom Modells generierte Meldung gültiger JSON-Code ist.Wichtig: Wenn Sie den JSON-Modus verwenden, müssen Sie selbst das Modell auch über eine System- oder Benutzernachricht anweisen, JSON-Code zu erzeugen. Andernfalls generiert das Modell möglicherweise einen unendlichen Leerzeichenstrom, bis der Tokengrenzwert erreicht wird. Dies kann zu einer lange ausgeführten und scheinbar „hängenden“ Anforderung führen. Beachten Sie auch, dass der Meldungsinhalt teilweise abgeschnitten werden kann, wenn Sie finish_reason="length" verwenden. Damit wird angegeben, dass bei der Generierung max_tokens überschritten wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat. |
No |
Eigenschaften für „tool_resources“
code_interpreter
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_ids | array | Eine Liste mit Datei-IDs, die für das Tool code_interpreter zur Verfügung gestellt wurden. Dem Tool können maximal 20 Dateien zugeordnet sein. |
[] |
file_search
Name | Typ | Beschreibung | Standard |
---|---|---|---|
vector_store_ids | array | Der an diesen Assistenten angefügte Vektorspeicher. An den Assistenten kann maximal ein Vektorspeicher angefügt werden. |
|
vector_stores | array | Ein Hilfsprogramm, das dazu dient, einen Vektorspeicher mit Datei-IDs (file_ids) zu erstellen und an diesen Assistenten anzufügen. An den Assistenten kann maximal ein Vektorspeicher angefügt werden. |
modifyAssistantRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
model | No | |||
name | Zeichenfolge | Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen. |
No | |
Beschreibung | string | Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen. |
No | |
Setup | Zeichenfolge | Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 32.768 Zeichen. |
No | |
tools | array | Eine Liste der im Assistenten aktivierten Tools. Jeder Assistent kann maximal 128 Tools enthalten. Tools können vom Typ code_interpreter , retrieval oder function sein. |
No | [] |
tool_resources | Objekt | Eine Reihe von Ressourcen, die von den Tools des Assistenten verwendet werden. Die Ressourcen sind spezifisch für den Tooltyp. Beispielsweise erfordert das Tool code_interpreter eine Liste mit Datei-IDs, während das Tool file_search eine Liste mit Vektorspeicher-IDs erfordert. |
No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No | |
Temperatur | Zahl | Die zu verwendende Temperatur für die Stichprobenentnahme zwischen 0 und 2. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. |
No | 1 |
top_p | Zahl | Eine Alternative zur Stichprobenentnahme mit Temperatur, die sogenannte Kernstichprobenentnahme (Nucleus Sampling), bei dem das Modell die Ergebnisse der Token mit der Wahrscheinlichkeitsmasse „top_p“ berücksichtigt. Daher bedeutet 0,1, dass nur die Token berücksichtigt werden, die die oberen 10 % der Wahrscheinlichkeitsmasse umfassen. Wir empfehlen im Allgemeinen, dies oder die Temperatur zu ändern, aber nicht beides. |
No | 1 |
response_format | assistantsApiResponseFormatOption | Gibt das Format an, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106 .Das Festlegen auf { "type": "json_schema", "json_schema": {...} } stellt strukturierte Ausgaben, die garantieren, dass das Modell Ihrem bereitgestellten JSON-Schema entspricht, sicher. Weitere Informationen finden Sie in der Anleitung „Strukturierte Ausgaben“.Das Festlegen auf { "type": "json_object" } aktiviert den JSON-Modus, der sicherstellt, dass die vom Modells generierte Meldung gültiger JSON-Code ist.Wichtig: Wenn Sie den JSON-Modus verwenden, müssen Sie selbst das Modell auch über eine System- oder Benutzernachricht anweisen, JSON-Code zu erzeugen. Andernfalls generiert das Modell möglicherweise einen unendlichen Leerzeichenstrom, bis der Tokengrenzwert erreicht wird. Dies kann zu einer lange ausgeführten und scheinbar „hängenden“ Anforderung führen. Beachten Sie auch, dass der Meldungsinhalt teilweise abgeschnitten werden kann, wenn Sie finish_reason="length" verwenden. Damit wird angegeben, dass bei der Generierung max_tokens überschritten wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat. |
No |
Eigenschaften für „tool_resources“
code_interpreter
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_ids | array | Überschreibt die Liste mit den Datei-IDs, die für das Tool code_interpreter zur Verfügung gestellt wurden. Dem Tool können maximal 20 Dateien zugeordnet sein. |
[] |
file_search
Name | Typ | Beschreibung | Standard |
---|---|---|---|
vector_store_ids | array | Überschreibt den an diesen Assistenten angefügten Vektorspeicher. An den Assistenten kann maximal ein Vektorspeicher angefügt werden. |
deleteAssistantResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Ja | ||
deleted | boolean | Ja | ||
Objekt | Zeichenfolge | Ja |
Objektenumeration: DeleteAssistantResponseState
Wert | Beschreibung |
---|---|
assistant.deleted |
listAssistantsResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Objekt | Zeichenfolge | Ja | ||
data | array | Ja | ||
first_id | Zeichenfolge | Ja | ||
last_id | Zeichenfolge | Ja | ||
has_more | boolean | Ja |
assistantToolsCode
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Die Art des Tools, das definiert wird: code_interpreter |
Ja |
Typenumeration: assistantToolsCodeType
Wert | Beschreibung |
---|---|
code_interpreter |
assistantToolsFileSearch
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Die Art des Tools, das definiert wird: file_search |
Ja | |
file_search | Objekt | Überschreibungen für das Dateisuchtool | No |
Eigenschaften für „file_search“
max_num_results
Name | Typ | Beschreibung | Standard |
---|---|---|---|
max_num_results | integer | Die maximale Anzahl von Ergebnissen, die das Dateisuchtool ausgeben soll. Der Standardwert ist 20 für GPT-4*-Modelle und 5 für GPT-3.5-Turbo. Dieser Wert sollte zwischen 1 und einschließlich 50 liegen. Beachten Sie, dass das Dateisuchtool möglicherweise weniger als max_num_results Ergebnisse ausgibt. |
Typenumeration: assistantToolsFileSearchType
Wert | Beschreibung |
---|---|
file_search |
assistantToolsFileSearchTypeOnly
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Die Art des Tools, das definiert wird: file_search |
Ja |
Typenumeration: assistantToolsFileSearchType
Wert | Beschreibung |
---|---|
file_search |
assistantToolsFunction
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Die Art des Tools, das definiert wird: function |
Ja | |
Funktion | Objekt | Die Funktionsdefinition. | Ja |
Eigenschaften für „function“
Beschreibung
Name | Typ | Beschreibung | Default |
---|---|---|---|
Beschreibung | string | Eine Beschreibung des Zwecks der Funktion, die vom Modell verwendet wird, um auszuwählen, wann und wie die Funktion aufgerufen wird. |
name
Name | Typ | Beschreibung | Standard |
---|---|---|---|
name | Zeichenfolge | Der Name der Funktion, die aufgerufen werden soll. Muss aus a–z, A–Z, 0–9 bestehen oder Unterstriche und Bindestriche enthalten, maximale Länge: 64. |
Parameter
Name | Typ | Beschreibung | Standard |
---|---|---|---|
Parameter | chatCompletionFunctionParameters | Die von den Funktionen akzeptierten Parameter beschrieben als JSON-Schemaobjekt. Beispiele finden Sie in der Anleitung guide/ und die Dokumentation zum Format finden Sie in der JSON-Schemareferenz. |
Typenumeration: assistantToolsFunction
Wert | BESCHREIBUNG |
---|---|
Funktion |
truncationObject
Steuert, wie ein Thread vor der Ausführung abgeschnitten wird. Verwenden Sie diese Option, um das anfängliche Kontextfenster der Ausführung zu steuern.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Die für den Thread zu verwendende Kürzungsstrategie. Der Standardwert ist auto . Bei Verwendung von last_messages wird der Thread auf die n neuesten Nachrichten im Thread gekürzt. Bei Verwendung von auto werden Nachrichten in der Mitte des Threads gelöscht, um der Kontextlänge des Modells (max_prompt_tokens ) zu entsprechen. |
Ja | |
last_messages | integer | Die Anzahl der neuesten Nachrichten aus dem Thread, wenn der Kontext für die Ausführung konstruiert wird. | No |
Typenumeration: TruncationType
Wert | BESCHREIBUNG |
---|---|
auto | |
last_messages |
assistantsApiToolChoiceOption
Steuert, welches Tool (falls vorhanden) vom Modell aufgerufen wird.
none
bedeutet, dass das Modell kein Tool aufruft und stattdessen eine Meldung generiert.
auto
ist der Standardwert und bedeutet, dass das Modell zwischen dem Generieren einer Meldung und dem Aufrufen einer Funktion auswählen kann.
Wenn Sie ein bestimmtes Tool wie {"type": "file_search"}
oder {"type": "function", "function": {"name": "my_function"}}
angeben, wird das Modell gezwungen, dieses aufzurufen.
Mögliche Werte für diese Komponente:
assistantsNamedToolChoice
Gibt ein Tool an, das das Modell verwenden soll. Wird verwendet, um zu erzwingen, dass das Modell ein bestimmtes Tool aufruft.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Der Typ des Tools. Wenn der Typ function ist, muss der Funktionsname festgelegt werden. |
Ja | |
Funktion | Objekt | No |
Eigenschaften für „function“
name
Name | Typ | Beschreibung | Standard |
---|---|---|---|
name | Zeichenfolge | Der Name der aufzurufenden Funktion. |
Typenumeration: AssistantsNamedToolChoiceType
Wert | BESCHREIBUNG |
---|---|
Funktion | |
code_interpreter | |
file_search |
runObject
Stellt eine Ausführung dar, die in einem Thread ausgeführt wird.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Der Bezeichner, auf den in API-Endpunkten verwiesen werden kann | Ja | |
Objekt | Zeichenfolge | Der Objekttyp, der immer thread.run ist. |
Ja | |
created_at | integer | Der Unix-Zeitstempel (in Sekunden) des Zeitpunkts, zu dem die Ausführung erstellt wurde | Ja | |
thread_id | Zeichenfolge | Die ID des Threads, der als Teil dieser Ausführung ausgeführt wurde | Ja | |
assistant_id | Zeichenfolge | Die ID des Assistenten, der für diese Ausführung verwendet wird | Ja | |
Status | Zeichenfolge | Der Status der Ausführung, entweder queued , in_progress , requires_action , cancelling , cancelled , failed , completed oder expired |
Ja | |
required_action | Objekt | Details zu der Aktion, die zum Fortsetzen der Ausführung erforderlich ist. Ist null , wenn keine Aktion erforderlich ist. |
Ja | |
last_error | Objekt | Der letzte Fehler im Zusammenhang mit dieser Ausführung. Ist null , wenn keine Fehler vorliegen. |
Ja | |
expires_at | integer | Der Unix-Zeitstempel (in Sekunden) des Zeitpunkts, zu dem die Ausführung abläuft | Ja | |
started_at | integer | Der Unix-Zeitstempel (in Sekunden) des Zeitpunkts, zu dem die Ausführung gestartet wurde | Ja | |
cancelled_at | integer | Der UNIX-Zeitstempel (in Sekunden) des Zeitpunkts, zu dem die Ausführung abgebrochen wurde. | Ja | |
failed_at | integer | Der Unix-Zeitstempel (in Sekunden) des Zeitpunkts, zu dem die Ausführung fehlgeschlagen ist | Ja | |
completed_at | integer | Der Unix-Zeitstempel (in Sekunden) des Zeitpunkts, zu dem die Ausführung abgeschlossen wurde | Ja | |
incomplete_details | Objekt | Details zum Grund für die unvollständige Ausführung. Ist null , wenn die Ausführung nicht unvollständig ist. |
Ja | |
Modell | Zeichenfolge | Das Modell, das der Assistent für diese Ausführung verwendet hat. | Ja | |
Setup | Zeichenfolge | Die Anweisungen, die der Assistent für diese Ausführung verwendet hat | Ja | |
tools | array | Die Liste der Tools, die der Assistent für diese Ausführung verwendet hat | Ja | [] |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
Ja | |
Nutzung | runCompletionUsage | Verwendungsstatistiken im Zusammenhang mit der Ausführung. Dieser Wert ist null , wenn sich die Ausführung nicht in einem Endzustand (d. h. in_progress , queued usw.) befindet. |
Ja | |
Temperatur | Zahl | Die für diese Ausführung verwendete Temperatur für die Stichprobenentnahme. Ohne Angabe wird standardmäßig „1“ verwendet. | No | |
top_p | Zahl | Der für diese Ausführung verwendete Wert für die Nukleus-Stichprobenentnahme. Ohne Angabe wird standardmäßig „1“ verwendet. | No | |
max_prompt_tokens | integer | Die maximale Anzahl an Eingabeaufforderungstoken, die im Laufe der Ausführung verwendet wurden |
Ja | |
max_completion_tokens | integer | Die maximale Anzahl an Abschlusstoken, die im Laufe der Ausführung verwendet wurden |
Ja | |
truncation_strategy | truncationObject | Steuert, wie ein Thread vor der Ausführung abgeschnitten wird. Verwenden Sie diese Option, um das anfängliche Kontextfenster der Ausführung zu steuern. | Ja | |
Toolauswahl | assistantsApiToolChoiceOption | Steuert, welches Tool (falls vorhanden) vom Modell aufgerufen wird.none bedeutet, dass das Modell kein Tool aufruft und stattdessen eine Meldung generiert.auto ist der Standardwert und bedeutet, dass das Modell zwischen dem Generieren einer Meldung und dem Aufrufen einer Funktion auswählen kann.Wenn Sie ein bestimmtes Tool wie {"type": "file_search"} oder {"type": "function", "function": {"name": "my_function"}} angeben, wird das Modell gezwungen, dieses aufzurufen. |
Ja | |
parallel_tool_calls | ParallelToolCalls | Gibt an, ob beim Verwenden des Tools parallele Funktionsaufrufe aktiviert werden sollen. | Nein | True |
response_format | assistantsApiResponseFormatOption | Gibt das Format an, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106 .Das Festlegen auf { "type": "json_schema", "json_schema": {...} } stellt strukturierte Ausgaben, die garantieren, dass das Modell Ihrem bereitgestellten JSON-Schema entspricht, sicher. Weitere Informationen finden Sie in der Anleitung „Strukturierte Ausgaben“.Das Festlegen auf { "type": "json_object" } aktiviert den JSON-Modus, der sicherstellt, dass die vom Modells generierte Meldung gültiger JSON-Code ist.Wichtig: Wenn Sie den JSON-Modus verwenden, müssen Sie selbst das Modell auch über eine System- oder Benutzernachricht anweisen, JSON-Code zu erzeugen. Andernfalls generiert das Modell möglicherweise einen unendlichen Leerzeichenstrom, bis der Tokengrenzwert erreicht wird. Dies kann zu einer lange ausgeführten und scheinbar „hängenden“ Anforderung führen. Beachten Sie auch, dass der Meldungsinhalt teilweise abgeschnitten werden kann, wenn Sie finish_reason="length" verwenden. Damit wird angegeben, dass bei der Generierung max_tokens überschritten wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat. |
Ja |
Eigenschaften für „required_action“
Typ
Name | Typ | Beschreibung | Standard |
---|---|---|---|
Typ | Zeichenfolge | Dieser Wert ist vorerst immer submit_tool_outputs . |
submit_tool_outputs
Name | Typ | Beschreibung | Standard |
---|---|---|---|
tool_calls | array | Eine Liste mit den relevanten Toolaufrufen. |
Eigenschaften für „last_error“
code
Name | Typ | Beschreibung | Standard |
---|---|---|---|
Code | Zeichenfolge | Einer der folgenden Werte: server_error oder rate_limit_exceeded . |
message
Name | Typ | Beschreibung | Standard |
---|---|---|---|
message | Zeichenfolge | Eine für Menschen lesbare Beschreibung des Fehlers. |
Eigenschaften für „incomplete_details“
reason
Name | Typ | Beschreibung | Standard |
---|---|---|---|
reason | Zeichenfolge | Der Grund für die unvollständige Ausführung. Gibt an, welcher spezifische Tokengrenzwert im Laufe der Ausführung erreicht wurde. |
Objektenumeration: runObjectType
Wert | Beschreibung |
---|---|
thread.run | Der Ausführungsobjekttyp (immer „thread.run“). |
Statusenumeration: RunObjectStatus
Wert | Beschreibung |
---|---|
queued | Der Zustand „queued“ |
in_progress | Der Zustand „in_progress“ |
requires_action | Der Zustand „required_action“ |
cancelling | Der Zustand „cancelling“ |
cancelled | Der Zustand „cancelled“ |
„Fehlgeschlagen“ | Der Zustand „failed“ |
abgeschlossen | Der Zustand „completed“ |
abgelaufen | Der Zustand „abgelaufen“ |
createRunRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
assistant_id | Zeichenfolge | Die ID des Assistenten, der für diese Ausführung verwendet werden soll | Ja | |
Modell | Zeichenfolge | Die ID des Modells, das für diese Ausführung verwendet werden soll. Wenn hier ein Wert angegeben wird, überschreibt dieser das Modell, das dem Assistenten zugeordnet ist. Andernfalls wird das dem Assistenten zugeordnete Modell verwendet. | No | |
Setup | Zeichenfolge | Überschreibt die Standardsystemmeldung des Assistenten. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. | No | |
additional_instructions | Zeichenfolge | Fügt zusätzliche Anweisungen am Ende der Anweisungen für die Ausführung an. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern, ohne andere Anweisungen außer Kraft zu setzen. | No | |
additional_messages | array | Fügt dem Thread zusätzliche Nachrichten hinzu, bevor die Ausführung erstellt wird. | No | |
tools | array | Überschreibt die Tools, die der Assistent für diese Ausführung verwenden kann. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. | No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No | |
Temperatur | Zahl | Die zu verwendende Temperatur für die Stichprobenentnahme zwischen 0 und 2. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. |
No | 1 |
top_p | Zahl | Eine Alternative zur Stichprobenentnahme mit Temperatur, die sogenannte Kernstichprobenentnahme (Nucleus Sampling), bei dem das Modell die Ergebnisse der Token mit der Wahrscheinlichkeitsmasse „top_p“ berücksichtigt. Daher bedeutet 0,1, dass nur die Token berücksichtigt werden, die die oberen 10 % der Wahrscheinlichkeitsmasse umfassen. Wir empfehlen im Allgemeinen, dies oder die Temperatur zu ändern, aber nicht beides. |
No | 1 |
Datenstrom | boolean | Bei Verwendung von true wird ein Datenstrom von Ereignissen, die während der Ausführung auftreten, als vom Server gesendete Ereignisse zurückgegeben. Der Datenstrom wird beendet, wenn die Ausführung einen Endzustand mit einer Nachricht vom Typ data: [DONE] erreicht. |
No | |
max_prompt_tokens | integer | Die maximale Anzahl von Prompttokens, die im Laufe der Ausführung verwendet werden können. Bei der Ausführung wird bestmöglich versucht, über mehrere Durchläufe der Ausführung hinweg nur die angegebene Anzahl von Prompttoken zu verwenden. Wenn die Ausführung die angegebene Anzahl von Prompttoken überschreitet, endet die Ausführung mit dem Status incomplete . Weitere Informationen finden Sie unter incomplete_details . |
No | |
max_completion_tokens | integer | Die maximale Anzahl von Vervollständigungstokens, die im Laufe der Ausführung verwendet werden können. Bei der Ausführung wird bestmöglich versucht, über mehrere Durchläufe der Ausführung hinweg nur die angegebene Anzahl von Vervollständigungstoken zu verwenden. Wenn die Ausführung die angegebene Anzahl von Vervollständigungstoken überschreitet, endet die Ausführung mit dem Status incomplete . Weitere Informationen finden Sie unter incomplete_details . |
No | |
truncation_strategy | truncationObject | Steuert, wie ein Thread vor der Ausführung abgeschnitten wird. Verwenden Sie diese Option, um das anfängliche Kontextfenster der Ausführung zu steuern. | No | |
Toolauswahl | assistantsApiToolChoiceOption | Steuert, welches Tool (falls vorhanden) vom Modell aufgerufen wird.none bedeutet, dass das Modell kein Tool aufruft und stattdessen eine Meldung generiert.auto ist der Standardwert und bedeutet, dass das Modell zwischen dem Generieren einer Meldung und dem Aufrufen einer Funktion auswählen kann.Wenn Sie ein bestimmtes Tool wie {"type": "file_search"} oder {"type": "function", "function": {"name": "my_function"}} angeben, wird das Modell gezwungen, dieses aufzurufen. |
No | |
parallel_tool_calls | ParallelToolCalls | Gibt an, ob beim Verwenden des Tools parallele Funktionsaufrufe aktiviert werden sollen. | Nein | True |
response_format | assistantsApiResponseFormatOption | Gibt das Format an, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106 .Das Festlegen auf { "type": "json_schema", "json_schema": {...} } stellt strukturierte Ausgaben, die garantieren, dass das Modell Ihrem bereitgestellten JSON-Schema entspricht, sicher. Weitere Informationen finden Sie in der Anleitung „Strukturierte Ausgaben“.Das Festlegen auf { "type": "json_object" } aktiviert den JSON-Modus, der sicherstellt, dass die vom Modells generierte Meldung gültiger JSON-Code ist.Wichtig: Wenn Sie den JSON-Modus verwenden, müssen Sie selbst das Modell auch über eine System- oder Benutzernachricht anweisen, JSON-Code zu erzeugen. Andernfalls generiert das Modell möglicherweise einen unendlichen Leerzeichenstrom, bis der Tokengrenzwert erreicht wird. Dies kann zu einer lange ausgeführten und scheinbar „hängenden“ Anforderung führen. Beachten Sie auch, dass der Meldungsinhalt teilweise abgeschnitten werden kann, wenn Sie finish_reason="length" verwenden. Damit wird angegeben, dass bei der Generierung max_tokens überschritten wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat. |
No |
listRunsResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Objekt | Zeichenfolge | Ja | ||
data | array | Ja | ||
first_id | Zeichenfolge | Ja | ||
last_id | Zeichenfolge | Ja | ||
has_more | boolean | Ja |
modifyRunRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No |
submitToolOutputsRunRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
tool_outputs | array | Eine Liste der Tools, für die die Ausgaben übermittelt werden | Ja | |
Datenstrom | boolean | Bei Verwendung von true wird ein Datenstrom von Ereignissen, die während der Ausführung auftreten, als vom Server gesendete Ereignisse zurückgegeben. Der Datenstrom wird beendet, wenn die Ausführung einen Endzustand mit einer Nachricht vom Typ data: [DONE] erreicht. |
No |
runToolCallObject
Toolaufrufobjekte
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Die ID des Toolaufrufs Auf diese ID muss verwiesen werden, wenn Sie die Toolausgaben mit „Toolausgaben übermitteln“ zum Ausführen des Endpunkts übermitteln. | Ja | |
Typ | Zeichenfolge | Der Typ des Toolaufrufs, für den die Ausgabe erforderlich ist. Dieser Wert ist vorerst immer function . |
Ja | |
Funktion | Objekt | Die Funktionsdefinition. | Ja |
Eigenschaften für „function“
name
Name | Typ | Beschreibung | Standard |
---|---|---|---|
name | Zeichenfolge | Der Name der Funktion. |
Argumente
Name | Typ | Beschreibung | Standard |
---|---|---|---|
Argumente | Zeichenfolge | Die Argumente, von denen das Modell erwartet, dass Sie sie an die Funktion übergeben. |
Typenumeration: RunToolCallObjectType
Wert | BESCHREIBUNG |
---|---|
Funktion |
createThreadAndRunRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
assistant_id | Zeichenfolge | Die ID des Assistenten, der für diese Ausführung verwendet werden soll | Ja | |
Thread | createThreadRequest | No | ||
model | Zeichenfolge | Die ID des Modells, das für diese Ausführung verwendet werden soll. Wenn hier ein Wert angegeben wird, überschreibt dieser das Modell, das dem Assistenten zugeordnet ist. Andernfalls wird das dem Assistenten zugeordnete Modell verwendet. | No | |
Setup | Zeichenfolge | Überschreibt die Standardsystemmeldung des Assistenten. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. | No | |
tools | array | Überschreibt die Tools, die der Assistent für diese Ausführung verwenden kann. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. | No | |
tool_resources | Objekt | Eine Reihe von Ressourcen, die von den Tools des Assistenten verwendet werden. Die Ressourcen sind spezifisch für den Tooltyp. Beispielsweise erfordert das Tool code_interpreter eine Liste mit Datei-IDs, während das Tool file_search eine Liste mit Vektorspeicher-IDs erfordert. |
No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No | |
Temperatur | Zahl | Die zu verwendende Temperatur für die Stichprobenentnahme zwischen 0 und 2. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. |
No | 1 |
top_p | Zahl | Eine Alternative zur Stichprobenentnahme mit Temperatur, die sogenannte Kernstichprobenentnahme (Nucleus Sampling), bei dem das Modell die Ergebnisse der Token mit der Wahrscheinlichkeitsmasse „top_p“ berücksichtigt. Daher bedeutet 0,1, dass nur die Token berücksichtigt werden, die die oberen 10 % der Wahrscheinlichkeitsmasse umfassen. Wir empfehlen im Allgemeinen, dies oder die Temperatur zu ändern, aber nicht beides. |
No | 1 |
Datenstrom | boolean | Bei Verwendung von true wird ein Datenstrom von Ereignissen, die während der Ausführung auftreten, als vom Server gesendete Ereignisse zurückgegeben. Der Datenstrom wird beendet, wenn die Ausführung einen Endzustand mit einer Nachricht vom Typ data: [DONE] erreicht. |
No | |
stream_options | chatCompletionStreamOptions | Optionen für eine Streamingantwort. Legen Sie dies nur fest, wenn Sie stream: true festlegen. |
No | Keine |
max_prompt_tokens | integer | Die maximale Anzahl von Prompttokens, die im Laufe der Ausführung verwendet werden können. Bei der Ausführung wird bestmöglich versucht, über mehrere Durchläufe der Ausführung hinweg nur die angegebene Anzahl von Prompttoken zu verwenden. Wenn die Ausführung die angegebene Anzahl von Prompttoken überschreitet, endet die Ausführung mit dem Status incomplete . Weitere Informationen finden Sie unter incomplete_details . |
No | |
max_completion_tokens | integer | Die maximale Anzahl von Vervollständigungstokens, die im Laufe der Ausführung verwendet werden können. Bei der Ausführung wird bestmöglich versucht, über mehrere Durchläufe der Ausführung hinweg nur die angegebene Anzahl von Vervollständigungstoken zu verwenden. Wenn die Ausführung die angegebene Anzahl von Vervollständigungstoken überschreitet, endet die Ausführung mit dem Status incomplete . Weitere Informationen finden Sie unter incomplete_details . |
No | |
truncation_strategy | truncationObject | Steuert, wie ein Thread vor der Ausführung abgeschnitten wird. Verwenden Sie diese Option, um das anfängliche Kontextfenster der Ausführung zu steuern. | No | |
Toolauswahl | assistantsApiToolChoiceOption | Steuert, welches Tool (falls vorhanden) vom Modell aufgerufen wird.none bedeutet, dass das Modell kein Tool aufruft und stattdessen eine Meldung generiert.auto ist der Standardwert und bedeutet, dass das Modell zwischen dem Generieren einer Meldung und dem Aufrufen einer Funktion auswählen kann.Wenn Sie ein bestimmtes Tool wie {"type": "file_search"} oder {"type": "function", "function": {"name": "my_function"}} angeben, wird das Modell gezwungen, dieses aufzurufen. |
No | |
parallel_tool_calls | ParallelToolCalls | Gibt an, ob beim Verwenden des Tools parallele Funktionsaufrufe aktiviert werden sollen. | Nein | True |
response_format | assistantsApiResponseFormatOption | Gibt das Format an, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106 .Das Festlegen auf { "type": "json_schema", "json_schema": {...} } stellt strukturierte Ausgaben, die garantieren, dass das Modell Ihrem bereitgestellten JSON-Schema entspricht, sicher. Weitere Informationen finden Sie in der Anleitung „Strukturierte Ausgaben“.Das Festlegen auf { "type": "json_object" } aktiviert den JSON-Modus, der sicherstellt, dass die vom Modells generierte Meldung gültiger JSON-Code ist.Wichtig: Wenn Sie den JSON-Modus verwenden, müssen Sie selbst das Modell auch über eine System- oder Benutzernachricht anweisen, JSON-Code zu erzeugen. Andernfalls generiert das Modell möglicherweise einen unendlichen Leerzeichenstrom, bis der Tokengrenzwert erreicht wird. Dies kann zu einer lange ausgeführten und scheinbar „hängenden“ Anforderung führen. Beachten Sie auch, dass der Meldungsinhalt teilweise abgeschnitten werden kann, wenn Sie finish_reason="length" verwenden. Damit wird angegeben, dass bei der Generierung max_tokens überschritten wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat. |
No |
Eigenschaften für „tool_resources“
code_interpreter
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_ids | array | Eine Liste mit Datei-IDs, die für das Tool code_interpreter zur Verfügung gestellt wurden. Dem Tool können maximal 20 Dateien zugeordnet sein. |
[] |
file_search
Name | Typ | Beschreibung | Standard |
---|---|---|---|
vector_store_ids | array | Die ID des an diesen Assistenten angefügten Vektorspeichers. An den Assistenten kann maximal ein Vektorspeicher angefügt werden. |
threadObject
Stellt einen Thread dar, der Nachrichten enthält.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Der Bezeichner, auf den in API-Endpunkten verwiesen werden kann | Ja | |
Objekt | Zeichenfolge | Der Objekttyp, der immer thread ist. |
Ja | |
created_at | integer | Der Unix-Zeitstempel (in Sekunden) des Zeitpunkts, zu dem der Thread erstellt wurde. | Ja | |
tool_resources | Objekt | Eine Reihe von Ressourcen, die für die Tools des Assistenten in diesem Thread verfügbar gemacht werden. Die Ressourcen sind spezifisch für den Tooltyp. Beispielsweise erfordert das Tool code_interpreter eine Liste mit Datei-IDs, während das Tool file_search eine Liste mit Vektorspeicher-IDs erfordert. |
Ja | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
Ja |
Eigenschaften für „tool_resources“
code_interpreter
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_ids | array | Eine Liste mit Datei-IDs, die für das Tool code_interpreter zur Verfügung gestellt wurden. Dem Tool können maximal 20 Dateien zugeordnet sein. |
[] |
file_search
Name | Typ | Beschreibung | Standard |
---|---|---|---|
vector_store_ids | array | Der an diesen Thread angefügte Vektorspeicher. An den Thread kann maximal ein Vektorspeicher angefügt werden. |
Objektenumeration: ThreadObjectType
Wert | Beschreibung |
---|---|
Thread | Die Art des Threadobjekts (immer thread ). |
createThreadRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Cloud an das Gerät | array | Eine Liste der Nachrichten, mit der der Thread gestartet werden soll. | No | |
tool_resources | Objekt | Eine Reihe von Ressourcen, die für die Tools des Assistenten in diesem Thread verfügbar gemacht werden. Die Ressourcen sind spezifisch für den Tooltyp. Beispielsweise erfordert das Tool code_interpreter eine Liste mit Datei-IDs, während das Tool file_search eine Liste mit Vektorspeicher-IDs erfordert. |
No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No |
Eigenschaften für „tool_resources“
code_interpreter
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_ids | array | Eine Liste mit Datei-IDs, die für das Tool code_interpreter zur Verfügung gestellt wurden. Dem Tool können maximal 20 Dateien zugeordnet sein. |
[] |
file_search
Name | Typ | Beschreibung | Standard |
---|---|---|---|
vector_store_ids | array | Der an diesen Thread angefügte Vektorspeicher. An den Thread kann maximal ein Vektorspeicher angefügt werden. |
|
vector_stores | array | Ein Hilfsprogramm, das dazu dient, einen Vektorspeicher mit Datei-IDs (file_ids) zu erstellen und an diesen Thread anzufügen. An den Thread kann maximal ein Vektorspeicher angefügt werden. |
modifyThreadRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
tool_resources | Objekt | Eine Reihe von Ressourcen, die für die Tools des Assistenten in diesem Thread verfügbar gemacht werden. Die Ressourcen sind spezifisch für den Tooltyp. Beispielsweise erfordert das Tool code_interpreter eine Liste mit Datei-IDs, während das Tool file_search eine Liste mit Vektorspeicher-IDs erfordert. |
No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No |
Eigenschaften für „tool_resources“
code_interpreter
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_ids | array | Eine Liste mit Datei-IDs, die für das Tool code_interpreter zur Verfügung gestellt wurden. Dem Tool können maximal 20 Dateien zugeordnet sein. |
[] |
file_search
Name | Typ | Beschreibung | Standard |
---|---|---|---|
vector_store_ids | array | Der an diesen Thread angefügte Vektorspeicher. An den Thread kann maximal ein Vektorspeicher angefügt werden. |
deleteThreadResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Ja | ||
deleted | boolean | Ja | ||
Objekt | Zeichenfolge | Ja |
Objektenumeration: DeleteThreadResponseObjectState
Wert | Beschreibung |
---|---|
thread.deleted | Der Zustand des gelöschten Threadantwortobjekts (thread.deleted ) |
listThreadsResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Objekt | Zeichenfolge | Ja | ||
data | array | Ja | ||
first_id | Zeichenfolge | Ja | ||
last_id | Zeichenfolge | Ja | ||
has_more | boolean | Ja |
messageObject
Stellt eine Nachricht in einem Thread dar.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Der Bezeichner, auf den in API-Endpunkten verwiesen werden kann | Ja | |
Objekt | Zeichenfolge | Der Objekttyp, der immer thread.message ist. |
Ja | |
created_at | integer | Der Unix-Zeitstempel (in Sekunden) des Zeitpunkts, zu dem die Nachricht erstellt wurde. | Ja | |
thread_id | Zeichenfolge | Die Thread-ID, zu der diese Nachricht gehört. | Ja | |
Status | Zeichenfolge | Der Status der Nachricht (entweder in_progress , incomplete oder completed ). |
Ja | |
incomplete_details | Objekt | Gibt im Falle einer unvollständigen Nachricht an, warum die Nachricht unvollständig ist. | Ja | |
completed_at | integer | Der UNIX-Zeitstempel (in Sekunden) des Zeitpunkts, zu dem die Nachricht vervollständigt wurde. | Ja | |
incomplete_at | integer | Der UNIX-Zeitstempel (in Sekunden) des Zeitpunkts, zu dem die Nachricht als unvollständig markiert wurde. | Ja | |
role | Zeichenfolge | Die Entität, die die Nachricht generiert hat. Einer der folgenden Werte: user oder assistant . |
Ja | |
content | array | Der Inhalt der Nachricht im Textarray und/oder Bildern. | Ja | |
assistant_id | Zeichenfolge | Falls zutreffend, die ID des Assistenten, der diese Nachricht erstellt hat. | Ja | |
run_id | Zeichenfolge | Falls zutreffend, die ID der Ausführung, die der Erstellung dieser Nachricht zugeordnet ist. | Ja | |
Anhänge | array | Eine Liste mit Dateien, die an die Nachricht angefügt sind, und den Tools, denen sie hinzugefügt wurden. | Ja | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
Ja |
Eigenschaften für „incomplete_details“
reason
Name | Typ | Beschreibung | Standard |
---|---|---|---|
reason | Zeichenfolge | Der Grund, warum die Nachricht unvollständig ist. |
Objektenumeration: MessageObjectType
Wert | Beschreibung |
---|---|
thread.message | Der Nachrichtenobjekttyp (thread.message ). |
Statusenumeration: MessageObjectStatus
Wert | Beschreibung |
---|---|
in_progress | |
incomplete | |
abgeschlossen |
Rollenenumeration: MessageObjectRole
Wert | Beschreibung |
---|---|
user | |
assistant |
messageDeltaObject
Stellt ein Nachrichtendelta dar (also alle Felder für eine Nachricht, die ggf. während des Streamings geändert wurden).
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Der Bezeichner der Nachricht, auf den in API-Endpunkten verwiesen werden kann | Ja | |
Objekt | Zeichenfolge | Der Objekttyp, der immer thread.message.delta ist. |
Ja | |
delta | Objekt | Das Delta, das die Felder enthält, die sich in der Nachricht geändert haben | Ja |
Eigenschaften für „delta“
role
Name | Typ | Beschreibung | Standard |
---|---|---|---|
role | Zeichenfolge | Die Entität, die die Nachricht generiert hat. Einer der folgenden Werte: user oder assistant . |
Inhalt
Name | Typ | Beschreibung | Standard |
---|---|---|---|
content | array | Der Inhalt der Nachricht im Textarray und/oder Bildern. |
Objektenumeration: MessageDeltaObjectType
Wert | Beschreibung |
---|---|
thread.message.delta |
createMessageRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
role | Zeichenfolge | Die Rolle der Entität, die die Nachricht erstellt. Zulässige Werte sind: - user : Gibt an, dass die Nachricht von einem realen Benutzer gesendet wird, und sollte in den meisten Fällen verwendet werden, um benutzerseitig generierte Nachrichten darzustellen.- assistant : Gibt an, dass die Nachricht vom Assistenten generiert wird. Verwenden Sie diesen Wert, um Nachrichten aus dem Assistenten in die Unterhaltung einzufügen. |
Ja | |
content | Zeichenfolge | Der Inhalt der Nachricht. | Ja | |
Anhänge | array | Eine Liste mit Dateien, die an die Nachricht angefügt sind, und den Tools, denen sie hinzugefügt werden sollen. | No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No |
Rollenenumeration: CreateMessageRequestRole
Wert | Beschreibung |
---|---|
user | |
assistant |
modifyMessageRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No |
deleteMessageResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Ja | ||
deleted | boolean | Ja | ||
Objekt | Zeichenfolge | Ja |
Objektenumeration: DeleteMessageResponseObject
Wert | Beschreibung |
---|---|
thread.message.deleted | Der Status des Antwortobjekts für das Löschen einer Nachricht |
listMessagesResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Objekt | Zeichenfolge | Ja | ||
data | array | Ja | ||
first_id | Zeichenfolge | Ja | ||
last_id | Zeichenfolge | Ja | ||
has_more | boolean | Ja |
messageContentImageFileObject
Verweist auf eine Bilddatei im Inhalt einer Nachricht.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Immer image_file . |
Ja | |
image_file | Objekt | Ja |
Eigenschaften für „image_file“
file_id
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_id | Zeichenfolge | Die Datei-ID des Bilds im Nachrichteninhalt. |
Typenumeration: MessageContentImageFileObjectType
Wert | Beschreibung |
---|---|
image_file | Der Bilddateityp des Nachrichteninhalts. |
messageContentTextObject
Der Textinhalt, der Teil einer Nachricht ist.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Immer text . |
Ja | |
Text | Objekt | Ja |
Eigenschaften für „text“
value
Name | Typ | Beschreibung | Standard |
---|---|---|---|
value | Zeichenfolge | Die Daten, aus denen der Text besteht. |
annotations
Name | Typ | Beschreibung | Standard |
---|---|---|---|
annotations | array |
Typenumeration: messageContentTextObjectType
Wert | Beschreibung |
---|---|
Text | Der Objekttyp des Texts im Nachrichteninhalt. |
messageContentTextAnnotationsFileCitationObject
Ein Zitat innerhalb der Nachricht, das auf ein bestimmtes Zitat aus einer bestimmten Datei verweist, die dem Assistenten oder der Nachricht zugeordnet ist. Wird generiert, wenn der Assistent das Tool „retrieval“ für die Dateisuche verwendet.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Immer file_citation . |
Ja | |
Text | Zeichenfolge | Der Text im Nachrichteninhalt, der ersetzt werden muss. | Ja | |
file_citation | Objekt | Ja | ||
start_index | integer | Ja | ||
end_index | integer | Ja |
Eigenschaften für „file_citation“
file_id
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_id | Zeichenfolge | Die ID der spezifischen Datei, aus der das Zitat stammt. |
Typenumeration: FileCitationObjectType
Wert | Beschreibung |
---|---|
file_citation | Der Objekttyp des Dateizitats. |
messageContentTextAnnotationsFilePathObject
Eine URL für die Datei, die generiert wird, wenn der Assistent das Tool code_interpreter
zum Generieren einer Datei verwendet hat.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Immer file_path . |
Ja | |
Text | Zeichenfolge | Der Text im Nachrichteninhalt, der ersetzt werden muss. | Ja | |
file_path | Objekt | Ja | ||
start_index | integer | Ja | ||
end_index | integer | Ja |
Eigenschaften für „file_path“
file_id
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_id | Zeichenfolge | Die ID der generierten Datei. |
Typenumeration: FilePathObjectType
Wert | Beschreibung |
---|---|
file_path | Der Objekttyp des Dateipfads. |
messageDeltaContentImageFileObject
Verweist auf eine Bilddatei im Inhalt einer Nachricht.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Index | integer | Der Index des Inhaltsteils in der Nachricht. | Ja | |
Typ | Zeichenfolge | Immer image_file . |
Ja | |
image_file | Objekt | No |
Eigenschaften für „image_file“
file_id
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_id | Zeichenfolge | Die Datei-ID des Bilds im Nachrichteninhalt. |
Typenumeration: MessageDeltaContentImageFileObjectType
Wert | Beschreibung |
---|---|
image_file |
messageDeltaContentTextObject
Der Textinhalt, der Teil einer Nachricht ist.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Index | integer | Der Index des Inhaltsteils in der Nachricht. | Ja | |
Typ | Zeichenfolge | Immer text . |
Ja | |
Text | Objekt | No |
Eigenschaften für „text“
value
Name | Typ | Beschreibung | Standard |
---|---|---|---|
value | Zeichenfolge | Die Daten, aus denen der Text besteht. |
annotations
Name | Typ | Beschreibung | Standard |
---|---|---|---|
annotations | array |
Typenumeration: MessageDeltaContentTextObjectType
Wert | Beschreibung |
---|---|
Text |
messageDeltaContentTextAnnotationsFileCitationObject
Ein Zitat innerhalb der Nachricht, das auf ein bestimmtes Zitat aus einer bestimmten Datei verweist, die dem Assistenten oder der Nachricht zugeordnet ist. Wird generiert, wenn der Assistent das Tool „file_search“ für die Dateisuche verwendet.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Index | integer | Der Index der Anmerkung im Textinhaltsteil. | Ja | |
Typ | Zeichenfolge | Immer file_citation . |
Ja | |
Text | Zeichenfolge | Der Text im Nachrichteninhalt, der ersetzt werden muss. | No | |
file_citation | Objekt | No | ||
start_index | integer | No | ||
end_index | integer | No |
Eigenschaften für „file_citation“
file_id
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_id | Zeichenfolge | Die ID der spezifischen Datei, aus der das Zitat stammt. |
Quote
Name | Typ | Beschreibung | Standard |
---|---|---|---|
Quote | Zeichenfolge | Das spezifische Zitat in der Datei. |
Typenumeration: MessageDeltaContentTextAnnotationsFileCitationObjectType
Wert | Beschreibung |
---|---|
file_citation |
messageDeltaContentTextAnnotationsFilePathObject
Eine URL für die Datei, die generiert wird, wenn der Assistent das Tool code_interpreter
zum Generieren einer Datei verwendet hat.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Index | integer | Der Index der Anmerkung im Textinhaltsteil. | Ja | |
Typ | Zeichenfolge | Immer file_path . |
Ja | |
Text | Zeichenfolge | Der Text im Nachrichteninhalt, der ersetzt werden muss. | No | |
file_path | Objekt | No | ||
start_index | integer | No | ||
end_index | integer | No |
Eigenschaften für „file_path“
file_id
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_id | Zeichenfolge | Die ID der generierten Datei. |
Typenumeration: MessageDeltaContentTextAnnotationsFilePathObjectType
Wert | Beschreibung |
---|---|
file_path |
runStepObject
Stellt einen Schritt in einer Ausführung dar.
| Name | Typ | Beschreibung | Erforderlich | Standard | |------|------|-------------|----------|---------| | ID | Zeichenfolge | Der Bezeichner des Ausführungsschritts, auf den in API-Endpunkten verwiesen werden kann. | Ja | | | Objekt | Zeichenfolge | Der Objekttyp, der immer „assistant.run.step``. | Yes | | | created_at | integer | The Unix timestamp (in seconds) for when the run step was created. | Yes | | | assistant_id | string | The ID of the assistant associated with the run step. | Yes | | | thread_id | string | The ID of the thread that was run. | Yes | | | run_id | string | The ID of the run) that this run step is a part of. | Yes | | | type | string | The type of run step, which can be either
message_creationor
tool_calls. | Yes | | | status | string | The status of the run, which can be either
in_progress,
cancelled,
failed,
completed, or
expired. | Yes | | | step_details | [runStepDetailsMessageCreationObject](#runstepdetailsmessagecreationobject) or [runStepDetailsToolCallsObject](#runstepdetailstoolcallsobject) | The details of the run step. | Yes | | | last_error | object | The last error associated with this run step. Will be
null`“, wenn keine Fehler vorhanden sind. | Ja | | | abgelaufen_am | Integer | Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Ausführungsschritt abgelaufen ist. Ein Schritt gilt als abgelaufen, wenn die übergeordnete Ausführung abgelaufen ist. | Ja | | | abgebrochen_am | Integer | Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Ausführungsschritt abgebrochen wurde. | Ja | | | Fehler_am | Integer | x-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Ausführungsschritt abgelaufen ist. | Ja | | | abgeschlossen_am | Integer | Der Unix-Zeitstempel (in Sekunden) für Zeitpunkt, an dem der Ausführungsschritt abgeschlossen wurde. | Ja | | | Metadaten | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein.
| Ja | |
Eigenschaften für „last_error“
code
Name | Typ | Beschreibung | Standard |
---|---|---|---|
Code | Zeichenfolge | Einer der folgenden Werte: server_error oder rate_limit_exceeded . |
message
Name | Typ | Beschreibung | Standard |
---|---|---|---|
message | Zeichenfolge | Eine für Menschen lesbare Beschreibung des Fehlers. |
Objektenumeration: RunStepObjectType
Wert | Beschreibung |
---|---|
assistant.run.step | Der Objekttyp, der immer assistant.run.step ist. |
Typenumeration: RunStepObjectType
Wert | Beschreibung |
---|---|
message_creation | Der Ausführungsschritt „message_creation“ |
tool_calls | Der Ausführungsschritt „tool_calls“ |
Statusenumeration: RunStepObjectStatus
Wert | Beschreibung |
---|---|
in_progress | Der Ausführungsstatus „in_progress“ |
cancelled | Der Ausführungsstatus „cancelled“ |
„Fehlgeschlagen“ | Der Ausführungsstatus „cancelled“ |
abgeschlossen | Der Ausführungsstatus „cancelled“ |
abgelaufen | Der Ausführungsstatus „cancelled“ |
runStepDeltaObject
Stellt ein Ausführungsschrittdelta dar (also alle Felder für einen Ausführungsschritt, die ggf. während des Streamings geändert wurden).
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Der Bezeichner des Ausführungsschritts, auf die in API-Endpunkten verwiesen werden kann | Ja | |
Objekt | Zeichenfolge | Der Objekttyp, der immer thread.run.step.delta ist. |
Ja | |
delta | Objekt | Das Delta mit den Feldern, die sich im Ausführungsschritt geändert haben. | Ja |
Eigenschaften für „delta“
step_details
Name | Typ | Beschreibung | Standard |
---|---|---|---|
step_details | runStepDeltaStepDetailsMessageCreationObject oder runStepDeltaStepDetailsToolCallsObject | Die Details des Ausführungsschritts |
Objektenumeration: RunStepDeltaObjectType
Wert | Beschreibung |
---|---|
thread.run.step.delta |
listRunStepsResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Objekt | Zeichenfolge | Ja | ||
data | array | Ja | ||
first_id | Zeichenfolge | Ja | ||
last_id | Zeichenfolge | Ja | ||
has_more | boolean | Ja |
runStepDetailsMessageCreationObject
Details zur Nachrichterstellung durch den Ausführungsschritt.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Immer „message_creation“. | Ja | |
message_creation | Objekt | Ja |
Eigenschaften für „message_creation“
message_id
Name | Typ | Beschreibung | Standard |
---|---|---|---|
message_id | Zeichenfolge | Die ID der Nachricht, die von diesem Ausführungsschritt erstellt wurde. |
Typenumeration: RunStepDetailsMessageCreationObjectType
Wert | Beschreibung |
---|---|
message_creation |
runStepDeltaStepDetailsMessageCreationObject
Details zur Nachrichterstellung durch den Ausführungsschritt.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Immer message_creation . |
Ja | |
message_creation | Objekt | No |
Eigenschaften für „message_creation“
message_id
Name | Typ | Beschreibung | Standard |
---|---|---|---|
message_id | Zeichenfolge | Die ID der Nachricht, die von diesem Ausführungsschritt erstellt wurde. |
Typenumeration: RunStepDeltaStepDetailsMessageCreationObjectType
Wert | Beschreibung |
---|---|
message_creation |
runStepDetailsToolCallsObject
Details des Toolaufrufs.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Immer tool_calls . |
Ja | |
tool_calls | array | Ein Array mit Toolaufrufen, an denen der Ausführungsschritt beteiligt war. Diese können einem von drei Tooltypen zugeordnet sein: code_interpreter , retrieval oder function . |
Ja |
Typenumeration: RunStepDetailsToolCallsObjectType
Wert | Beschreibung |
---|---|
tool_calls |
runStepDeltaStepDetailsToolCallsObject
Details des Toolaufrufs.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Immer tool_calls . |
Ja | |
tool_calls | array | Ein Array mit Toolaufrufen, an denen der Ausführungsschritt beteiligt war. Diese können einem von drei Tooltypen zugeordnet sein: code_interpreter , file_search oder function . |
No |
Typenumeration: RunStepDeltaStepDetailsToolCallsObjectType
Wert | Beschreibung |
---|---|
tool_calls |
runStepDetailsToolCallsCodeObject
Details des Code-Interpreter-Toolaufrufs, an dem der Ausführungsschritt beteiligt war.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Die ID des Toolaufrufs | Ja | |
Typ | Zeichenfolge | Die Art des Toolaufrufs. Ist für diese Art von Toolaufruf immer code_interpreter . |
Ja | |
code_interpreter | Objekt | Die Definition des Code-Interpreter-Tools. | Ja |
Eigenschaften für „code_interpreter“
input
Name | Typ | Beschreibung | Standard |
---|---|---|---|
input | Zeichenfolge | Die Eingabe für den Code-Interpreter-Toolaufruf. |
outputs
Name | Typ | Beschreibung | Standard |
---|---|---|---|
outputs | array | Die Ausgaben des Code-Interpreter-Toolaufrufs. Der Code-Interpreter kann eines oder mehrere Elemente ausgeben, einschließlich Text (logs ) oder Bilder (image ). Jedes dieser Elemente wird durch einen anderen Objekttyp dargestellt. |
Typenumeration: RunStepDetailsToolCallsCodeObjectType
Wert | Beschreibung |
---|---|
code_interpreter |
runStepDeltaStepDetailsToolCallsCodeObject
Details des Code-Interpreter-Toolaufrufs, an dem der Ausführungsschritt beteiligt war.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Index | integer | Der Index des Toolaufrufs im Toolaufruf-Array. | Ja | |
id | Zeichenfolge | Die ID des Toolaufrufs | No | |
Typ | Zeichenfolge | Die Art des Toolaufrufs. Ist für diese Art von Toolaufruf immer code_interpreter . |
Ja | |
code_interpreter | Objekt | Die Definition des Code-Interpreter-Tools. | No |
Eigenschaften für „code_interpreter“
input
Name | Typ | Beschreibung | Standard |
---|---|---|---|
input | Zeichenfolge | Die Eingabe für den Code-Interpreter-Toolaufruf. |
outputs
Name | Typ | Beschreibung | Standard |
---|---|---|---|
outputs | array | Die Ausgaben des Code-Interpreter-Toolaufrufs. Der Code-Interpreter kann eines oder mehrere Elemente ausgeben, einschließlich Text (logs ) oder Bilder (image ). Jedes dieser Elemente wird durch einen anderen Objekttyp dargestellt. |
Typenumeration: RunStepDeltaStepDetailsToolCallsCodeObjectType
Wert | Beschreibung |
---|---|
code_interpreter |
runStepDetailsToolCallsCodeOutputLogsObject
Textausgabe des Code-Interpreter-Toolaufrufs im Rahmen eines Ausführungsschritts.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Immer logs . |
Ja | |
logs | Zeichenfolge | Die Textausgabe des Code-Interpreter-Toolaufrufs. | Ja |
Typenumeration: RunStepDetailsToolCallsCodeOutputLogsObjectType
Wert | Beschreibung |
---|---|
logs |
runStepDeltaStepDetailsToolCallsCodeOutputLogsObject
Textausgabe des Code-Interpreter-Toolaufrufs im Rahmen eines Ausführungsschritts.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Index | integer | Der Index der Ausgabe im Ausgaben-Array. | Ja | |
Typ | Zeichenfolge | Immer logs . |
Ja | |
logs | Zeichenfolge | Die Textausgabe des Code-Interpreter-Toolaufrufs. | No |
Typenumeration: RunStepDeltaStepDetailsToolCallsCodeOutputLogsObjectType
Wert | Beschreibung |
---|---|
logs |
runStepDetailsToolCallsCodeOutputImageObject
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Immer image . |
Ja | |
image | Objekt | Ja |
Eigenschaften für „image“
file_id
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_id | Zeichenfolge | Die Datei-ID des Bilds. |
Typenumeration: RunStepDetailsToolCallsCodeOutputImageObjectType
Wert | Beschreibung |
---|---|
image |
runStepDeltaStepDetailsToolCallsCodeOutputImageObject
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Index | integer | Der Index der Ausgabe im Ausgaben-Array. | Ja | |
Typ | Zeichenfolge | Immer image . |
Ja | |
image | Objekt | No |
Eigenschaften für „image“
file_id
Name | Typ | Beschreibung | Standard |
---|---|---|---|
file_id | Zeichenfolge | Die Datei-ID des Bilds. |
Typenumeration: RunStepDeltaStepDetailsToolCallsCodeOutputImageObject
Wert | Beschreibung |
---|---|
image |
runStepDetailsToolCallsFileSearchObject
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Die ID des Toolaufrufobjekts. | Ja | |
Typ | Zeichenfolge | Die Art des Toolaufrufs. Ist für diese Art von Toolaufruf immer file_search . |
Ja | |
file_search | Objekt | Ist vorerst immer ein leeres Objekt. | Ja |
Eigenschaften für „file_search“
results
Name | Typ | Beschreibung | Standard |
---|---|---|---|
results | array | Die Ergebnisse der Dateisuche. |
Typenumeration: RunStepDetailsToolCallsFileSearchObjectType
Wert | Beschreibung |
---|---|
file_search |
runStepDetailsToolCallsFileSearchResultObject
Eine Ergebnisinstanz der Dateisuche.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
file_id | Zeichenfolge | Die ID der Datei, in der das Ergebnis gefunden wurde. | Ja | |
file_name | Zeichenfolge | Der Name der Datei, in der das Ergebnis gefunden wurde. | Ja | |
Ergebnis Ihrer App | Zahl | Die Ergebnisbewertung. Alle Werte müssen eine Gleitkommazahl zwischen 0 und 1 sein. | Ja | |
content | array | Der Inhalt des gefundenen Ergebnisses. Der Inhalt wird nur einbezogen, wenn er über den Include-Abfrageparameter angefordert wird. | No |
runStepDeltaStepDetailsToolCallsFileSearchObject
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Index | integer | Der Index des Toolaufrufs im Toolaufruf-Array. | Ja | |
id | Zeichenfolge | Die ID des Toolaufrufobjekts. | No | |
Typ | Zeichenfolge | Die Art des Toolaufrufs. Ist für diese Art von Toolaufruf immer retrieval . |
Ja | |
file_search | Objekt | Ist vorerst immer ein leeres Objekt. | Ja |
Typenumeration: RunStepDeltaStepDetailsToolCallsFileSearchObjectType
Wert | Beschreibung |
---|---|
file_search |
runStepDetailsToolCallsFunctionObject
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Die ID des Toolaufrufobjekts. | Ja | |
Typ | Zeichenfolge | Die Art des Toolaufrufs. Ist für diese Art von Toolaufruf immer function . |
Ja | |
Funktion | Objekt | Die Definition der aufgerufenen Funktion. | Ja |
Eigenschaften für „function“
name
Name | Typ | Beschreibung | Standard |
---|---|---|---|
name | Zeichenfolge | Der Name der Funktion. |
Argumente
Name | Typ | Beschreibung | Standard |
---|---|---|---|
Argumente | Zeichenfolge | Die an die Funktion übergebenen Argumente. |
output
Name | Typ | Beschreibung | Standard |
---|---|---|---|
output | Zeichenfolge | Die Ausgabe der Funktion. Ist null , wenn die Ausgaben noch nicht übermittelt wurden. |
Typenumeration: RunStepDetailsToolCallsFunctionObjectType
Wert | BESCHREIBUNG |
---|---|
Funktion |
runStepDeltaStepDetailsToolCallsFunctionObject
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Index | integer | Der Index des Toolaufrufs im Toolaufruf-Array. | Ja | |
id | Zeichenfolge | Die ID des Toolaufrufobjekts. | No | |
Typ | Zeichenfolge | Die Art des Toolaufrufs. Ist für diese Art von Toolaufruf immer function . |
Ja | |
Funktion | Objekt | Die Definition der aufgerufenen Funktion. | No |
Eigenschaften für „function“
name
Name | Typ | Beschreibung | Standard |
---|---|---|---|
name | Zeichenfolge | Der Name der Funktion. |
Argumente
Name | Typ | Beschreibung | Standard |
---|---|---|---|
Argumente | Zeichenfolge | Die an die Funktion übergebenen Argumente. |
output
Name | Typ | Beschreibung | Standard |
---|---|---|---|
output | Zeichenfolge | Die Ausgabe der Funktion. Ist null , wenn die Ausgaben noch nicht übermittelt wurden. |
Typenumeration: RunStepDetailsToolCallsFunctionObjectType
Wert | BESCHREIBUNG |
---|---|
Funktion |
vectorStoreExpirationAfter
Die Ablaufrichtlinie für einen Vektorspeicher.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Anker | Zeichenfolge | Ankerzeitstempel, nach dem die Ablaufrichtlinie angewendet wird. Unterstützte Anker: last_active_at . |
Ja | |
days | integer | Gibt an, wie viele Tage nach der Ankerzeit der Vektorspeicher abläuft. | Ja |
Ankerenumeration: VectorStoreExpirationAfterAnchor
Wert | Beschreibung |
---|---|
last_active_at | Der Ankerzeitstempel, nach dem die Ablaufrichtlinie angewendet wird. |
vectorStoreObject
Ein Vektorspeicher ist eine Sammlung verarbeiteter Dateien, die vom Tool file_search
verwendet werden können.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Der Bezeichner, auf den in API-Endpunkten verwiesen werden kann | Ja | |
Objekt | enum | Der Objekttyp, der immer vector_store ist.Mögliche Werte: vector_store |
Ja | |
created_at | integer | Der UNIX-Zeitstempel (in Sekunden) für den Erstellungszeitpunkt des Vektorspeichers. | Yes | |
Name | Zeichenfolge | Der Name des Vektorspeichers. | Ja | |
usage_bytes | integer | Die Gesamtanzahl von Bytes, die von den Dateien im Vektorspeicher beansprucht werden. | Ja | |
file_counts | Objekt | Ja | ||
Status | Zeichenfolge | Der Status des Vektorspeichers (expired , in_progress oder completed ). Der Status completed bedeutet, dass der Vektorspeicher einsatzbereit ist. |
Ja | |
expires_after | vectorStoreExpirationAfter | Die Ablaufrichtlinie für einen Vektorspeicher. | No | |
expires_at | integer | Der UNIX-Zeitstempel (in Sekunden) für den Zeitpunkt, zu dem der Vektorspeicher abläuft. | No | |
last_active_at | integer | Der UNIX-Zeitstempel (in Sekunden) für den Zeitpunkt, zu dem der Vektorspeicher zuletzt aktiv war. | Ja | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
Ja |
Eigenschaften für „file_counts“
in_progress
Name | Typ | Beschreibung | Standard |
---|---|---|---|
in_progress | integer | Die Anzahl von Dateien, die derzeit verarbeitet werden. |
abgeschlossen
Name | Typ | Beschreibung | Standard |
---|---|---|---|
abgeschlossen | integer | Die Anzahl erfolgreich verarbeiteter Dateien. |
„Fehlgeschlagen“
Name | Typ | Beschreibung | Standard |
---|---|---|---|
„Fehlgeschlagen“ | integer | Die Anzahl von Dateien, die nicht verarbeitet werden konnten. |
cancelled
Name | Typ | Beschreibung | Standard |
---|---|---|---|
cancelled | integer | Die Anzahl von Dateien, die abgebrochen wurden. |
total
Name | Typ | Beschreibung | Standard |
---|---|---|---|
total | integer | Die Gesamtanzahl der Dateien. |
Statusenumeration: VectorStoreObjectStatus
Wert | Beschreibung |
---|---|
abgelaufen | |
in_progress | |
abgeschlossen |
createVectorStoreRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
file_ids | array | Eine Liste mit Datei-IDs, die vom Vektorspeicher verwendet werden sollen. Nützlich für Tools wie file_search , die auf Dateien zugreifen können. |
No | |
name | Zeichenfolge | Der Name des Vektorspeichers. | No | |
expires_after | vectorStoreExpirationAfter | Die Ablaufrichtlinie für einen Vektorspeicher. | No | |
chunking_strategy | autoChunkingStrategyRequestParam oder staticChunkingStrategyRequestParam | Die Segmentierungsstrategie, die verwendet wird, um die Datei(en) in Blöcke zu unterteilen. Wenn kein Wert angegeben ist, wird die Strategie auto verwendet. Gilt nur, wenn file_ids nicht leer ist. |
No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No |
updateVectorStoreRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
name | Zeichenfolge | Der Name des Vektorspeichers. | No | |
expires_after | vectorStoreExpirationAfter | Die Ablaufrichtlinie für einen Vektorspeicher. | No | |
metadata | Objekt | 16 Schlüssel-Wert-Paare, die an ein Objekt angefügt werden können. Dies kann hilfreich sein, um zusätzliche Informationen zum Objekt in einem strukturierten Format zu speichern. Schlüssel dürfen maximal 64 Zeichen und Werte dürfen höchstens 512 Zeichen lang sein. |
No |
listVectorStoresResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Objekt | Zeichenfolge | Ja | ||
data | array | Ja | ||
first_id | Zeichenfolge | Ja | ||
last_id | Zeichenfolge | Ja | ||
has_more | boolean | Ja |
deleteVectorStoreResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Ja | ||
deleted | boolean | Ja | ||
Objekt | Zeichenfolge | Ja |
Objektenumeration: DeleteVectorStoreResponseObject
Wert | Beschreibung |
---|---|
vector_store.deleted | Der Status des Antwortobjekts für das Löschen eines Vektorspeichers |
vectorStoreFileObject
Eine Liste der an einen Vektorspeicher angefügten Dateien.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Der Bezeichner, auf den in API-Endpunkten verwiesen werden kann | Ja | |
Objekt | Zeichenfolge | Der Objekttyp, der immer vector_store.file ist. |
Ja | |
usage_bytes | integer | Die Gesamtauslastung des Vektorspeichers in Bytes. Dies kann sich von der ursprünglichen Dateigröße unterscheiden. | Ja | |
created_at | integer | Der UNIX-Zeitstempel (in Sekunden) für den Erstellungszeitpunkt der Vektorspeicherdatei. | Ja | |
vector_store_id | Zeichenfolge | Die ID des Vektorspeichers, an den die Datei angefügt ist. | Ja | |
Status | Zeichenfolge | Der Status der Vektorspeicherdatei (in_progress , completed , cancelled oder failed ). Der Status completed bedeutet, dass die Vektorspeicherdatei einsatzbereit ist. |
Ja | |
last_error | Objekt | Der letzte Fehler im Zusammenhang mit dieser Vektorspeicherdatei. Ist null , wenn keine Fehler vorliegen. |
Ja | |
chunking_strategy | autoChunkingStrategyRequestParam oder staticChunkingStrategyRequestParam | Die Segmentierungsstrategie, die verwendet wird, um die Datei(en) in Blöcke zu unterteilen. Wenn kein Wert angegeben ist, wird die Strategie auto verwendet. Gilt nur, wenn file_ids nicht leer ist. |
No |
Eigenschaften für „last_error“
code
Name | Typ | Beschreibung | Standard |
---|---|---|---|
Code | Zeichenfolge | Einer von der folgenden Werte: server_error oder invalid_file oder unsupported_file . |
message
Name | Typ | Beschreibung | Standard |
---|---|---|---|
message | Zeichenfolge | Eine für Menschen lesbare Beschreibung des Fehlers. |
Objektenumeration: VectorStoreFileObjectType
Wert | Beschreibung |
---|---|
vector_store.file |
Statusenumeration: VectorStoreFileObjectStatus
Wert | Beschreibung |
---|---|
in_progress | |
abgeschlossen | |
cancelled | |
„Fehlgeschlagen“ |
otherChunkingStrategyResponseParam
Dies wird zurückgegeben, wenn die Segmentierungsstrategie unbekannt ist. In der Regel liegt dies daran, dass die Datei vor der Einführung des chunking_strategy
-Konzepts in der API indiziert wurde.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Immer other . |
Ja |
Typenumeration: OtherChunkingStrategyResponseParamType
Wert | Beschreibung |
---|---|
Andere |
staticChunkingStrategyResponseParam
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | Zeichenfolge | Immer static . |
Ja | |
static | staticChunkingStrategy | Ja |
Typenumeration: StaticChunkingStrategyResponseParamType
Wert | Beschreibung |
---|---|
static |
staticChunkingStrategy
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
max_chunk_size_tokens | integer | Die maximale Anzahl von Token in jedem Block. Der Standardwert ist 800 . Der Mindestwert ist 100 , und der maximale Wert ist 4,096 . |
Ja | |
chunk_overlap_tokens | integer | Die Anzahl von Token, die sich zwischen Blöcken überlappen. Der Standardwert ist 400 .Beachten Sie, dass die Überlappung nicht größer als die Hälfte des max_chunk_size_tokens -Werts sein darf. |
Ja |
autoChunkingStrategyRequestParam
Die Standardstrategie. Diese Strategie verwendet derzeit einen max_chunk_size_tokens
-Wert von 800
und einen chunk_overlap_tokens
-Wert von 400
.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | enum | Immer auto .Mögliche Werte: auto |
Ja |
staticChunkingStrategyRequestParam
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Typ | enum | Immer static .Mögliche Werte: static |
Ja | |
static | staticChunkingStrategy | Ja |
chunkingStrategyRequestParam
Die Segmentierungsstrategie, die verwendet wird, um die Datei(en) in Blöcke zu unterteilen. Wenn kein Wert angegeben ist, wird die Strategie auto
verwendet.
Mögliche Werte für diese Komponente:
createVectorStoreFileRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
file_id | Zeichenfolge | Eine Datei-ID, die vom Vektorspeicher verwendet werden soll. Nützlich für Tools wie file_search , die auf Dateien zugreifen können. |
Ja | |
chunking_strategy | chunkingStrategyRequestParam | Die Segmentierungsstrategie, die verwendet wird, um die Datei(en) in Blöcke zu unterteilen. Wenn kein Wert angegeben ist, wird die Strategie auto verwendet. |
No |
listVectorStoreFilesResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
Objekt | Zeichenfolge | Ja | ||
data | array | Ja | ||
first_id | Zeichenfolge | Ja | ||
last_id | Zeichenfolge | Ja | ||
has_more | boolean | Ja |
deleteVectorStoreFileResponse
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Ja | ||
deleted | boolean | Ja | ||
Objekt | Zeichenfolge | Ja |
Objektenumeration: DeleteVectorStoreFileResponseObject
Wert | Beschreibung |
---|---|
vector_store.file.deleted |
vectorStoreFileBatchObject
Eine Gruppe von Dateien, die an einen Vektorspeicher angefügt sind.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
id | Zeichenfolge | Der Bezeichner, auf den in API-Endpunkten verwiesen werden kann | Ja | |
Objekt | Zeichenfolge | Der Objekttyp, der immer vector_store.file_batch ist. |
Ja | |
created_at | integer | Der UNIX-Zeitstempel (in Sekunden) für den Erstellungszeitpunkt des Vektorspeicher-Dateibatchs. | Ja | |
vector_store_id | Zeichenfolge | Die ID des Vektorspeichers, an den die Datei angefügt ist. | Ja | |
Status | Zeichenfolge | Der Status des Vektorspeicher-Dateibatchs (in_progress , completed , cancelled oder failed ). |
Ja | |
file_counts | Objekt | Ja |
Eigenschaften für „file_counts“
in_progress
Name | Typ | Beschreibung | Standard |
---|---|---|---|
in_progress | integer | Die Anzahl von Dateien, die derzeit verarbeitet werden. |
abgeschlossen
Name | Typ | Beschreibung | Standard |
---|---|---|---|
abgeschlossen | integer | Die Anzahl verarbeiteter Dateien. |
„Fehlgeschlagen“
Name | Typ | Beschreibung | Standard |
---|---|---|---|
„Fehlgeschlagen“ | integer | Die Anzahl von Dateien, die nicht verarbeitet werden konnten. |
cancelled
Name | Typ | Beschreibung | Standard |
---|---|---|---|
cancelled | integer | Die Anzahl von Dateien, die abgebrochen wurden. |
total
Name | Typ | Beschreibung | Standard |
---|---|---|---|
total | integer | Die Gesamtanzahl der Dateien. |
Objektenumeration: VectorStoreFileBatchObjectType
Wert | Beschreibung |
---|---|
vector_store.files_batch |
Statusenumeration: VectorStoreFileBatchObjectStatus
Wert | Beschreibung |
---|---|
in_progress | |
abgeschlossen | |
cancelled | |
„Fehlgeschlagen“ |
createVectorStoreFileBatchRequest
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
file_ids | array | Eine Liste mit Datei-IDs, die vom Vektorspeicher verwendet werden sollen. Nützlich für Tools wie file_search , die auf Dateien zugreifen können. |
Ja | |
chunking_strategy | chunkingStrategyRequestParam | Die Segmentierungsstrategie, die verwendet wird, um die Datei(en) in Blöcke zu unterteilen. Wenn kein Wert angegeben ist, wird die Strategie auto verwendet. |
No |
assistantStreamEvent
Stellt ein Ereignis dar, das beim Streamen einer Ausführung ausgegeben wird.
Jedes Ereignis in einem vom Server gesendeten Ereignisdatenstrom verfügt über eine event
-Eigenschaft und über eine data
-Eigenschaft:
event: thread.created
data: {"id": "thread_123", "object": "thread", ...}
Ereignisse werden ausgegeben, wenn ein neues Objekt erstellt wird, in einen neuen Zustand übergeht oder in Teilen (Deltas) gestreamt wird. Beispielsweise wird thread.run.created
ausgegeben, wenn eine neue Ausführung erstellt wird, und thread.run.completed
, wenn eine Ausführung abgeschlossen wird. Wenn sich ein Assistent entscheidet, während einer Ausführung eine Nachricht zu erstellen, wird Folgendes in der angegebenen Reihenfolge ausgegeben: thread.message.created event
, ein thread.message.in_progress
-Ereignis, mehrere thread.message.delta
-Ereignisse und schließlich ein thread.message.completed
-Ereignis.
Im Laufe der Zeit kommen ggf. noch weitere Ereignisse hinzu. Daher empfiehlt es sich, unbekannte Ereignisse ordnungsgemäß in Ihrem Code zu behandeln.
Mögliche Werte für diese Komponente:
threadStreamEvent
Mögliche Werte für diese Komponente:
thread.created
Tritt auf, wenn ein neuer Thread erstellt wird.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | threadObject | Stellt einen Thread dar, der Nachrichten enthält. | Ja |
Daten: threadObject
Ereignisenumeration: ThreadStreamEventEnum
Wert | Beschreibung |
---|---|
thread.created | Das Threaderstellungsereignis. |
runStreamEvent
Mögliche Werte für diese Komponente:
thread.run.created
Tritt auf, wenn eine neue Ausführung erstellt wird.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. | Ja |
Daten: runObject
Ereignisenumeration: RunStreamEventCreated
Wert | Beschreibung |
---|---|
thread.run.created |
thread.run.queued
Tritt auf, wenn eine Ausführung in den queued
-Status wechselt.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. | Ja |
Daten: runObject
Ereignisenumeration: RunStreamEventQueued
Wert | Beschreibung |
---|---|
thread.run.queued |
thread.run.in_progress
Tritt auf, wenn eine Ausführung in einen Status vom Typ in_progress
wechselt.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. | Ja |
Daten: runObject
Ereignisenumeration: RunStreamEventInProgress
Wert | Beschreibung |
---|---|
thread.run.in_progress |
thread.run.requires_action
Tritt auf, wenn eine Ausführung in den requires_action
-Status wechselt.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. | Ja |
Daten: runObject
Ereignisenumeration: RunStreamEventRequiresAction
Wert | Beschreibung |
---|---|
thread.run.requires_action |
thread.run.completed
Tritt auf, wenn eine Ausführung abgeschlossen ist.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. | Ja |
Daten: runObject
Ereignisenumeration: RunStreamEventCompleted
Wert | Beschreibung |
---|---|
thread.run.completed |
thread.run.failed
Tritt auf, wenn eine Ausführung fehlschlägt.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. | Ja |
Daten: runObject
Ereignisenumeration: RunStreamEventFailed
Wert | Beschreibung |
---|---|
thread.run.failed |
thread.run.cancelling
Tritt auf, wenn eine Ausführung in den cancelling
-Status wechselt.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. | Ja |
Daten: runObject
Ereignisenumeration: RunStreamEventCancelling
Wert | Beschreibung |
---|---|
thread.run.cancelling |
thread.run.cancelled
Tritt auf, wenn eine Ausführung abgebrochen wird.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. | Ja |
Daten: runObject
Ereignisenumeration: RunStreamEventCancelled
Wert | Beschreibung |
---|---|
thread.run.cancelled |
thread.run.expired
Tritt auf, wenn eine Ausführung verfällt.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runObject | Stellt eine Ausführung dar, die in einem Thread ausgeführt wird. | Ja |
Daten: runObject
Ereignisenumeration: RunStreamEventExpired
Wert | Beschreibung |
---|---|
thread.run.expired |
runStepStreamEvent
Mögliche Werte für diese Komponente:
thread.run.step.created
Tritt auf, wenn ein Ausführungsschritt erstellt wird.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runStepObject | Stellt einen Schritt in einer Ausführung dar. |
Ja |
Daten: runStepObject
Ereignisenumeration: RunStepStreamEventCreated
Wert | Beschreibung |
---|---|
thread.run.step.created |
thread.run.step.in_progress
Tritt auf, wenn ein Ausführungsschritt in den in_progress
-Zustand übergeht.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runStepObject | Stellt einen Schritt in einer Ausführung dar. |
Ja |
Daten: runStepObject
Ereignisenumeration: RunStepStreamEventInProgress
Wert | Beschreibung |
---|---|
thread.run.step.in_progress |
thread.run.step.delta
Tritt auf, wenn Teile eines Ausführungsschritts gestreamt werden.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runStepDeltaObject | Stellt ein Ausführungsschrittdelta dar (also alle Felder für einen Ausführungsschritt, die ggf. während des Streamings geändert wurden). |
Ja |
Daten: runStepDeltaObject
Ereignisenumeration: RunStepStreamEventDelta
Wert | Beschreibung |
---|---|
thread.run.step.delta |
thread.run.step.completed
Tritt auf, wenn ein Ausführungsschritt abgeschlossen ist.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runStepObject | Stellt einen Schritt in einer Ausführung dar. |
Ja |
Daten: runStepObject
Ereignisenumeration: RunStepStreamEventCompleted
Wert | Beschreibung |
---|---|
thread.run.step.completed |
thread.run.step.failed
Tritt auf, wenn ein Ausführungsschritt fehlschlägt.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runStepObject | Stellt einen Schritt in einer Ausführung dar. |
Ja |
Daten: runStepObject
Ereignisenumeration: RunStepStreamEventFailed
Wert | Beschreibung |
---|---|
thread.run.step.failed |
thread.run.step.cancelled
Tritt auf, wenn ein Ausführungsschritt abgebrochen wird.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runStepObject | Stellt einen Schritt in einer Ausführung dar. |
Ja |
Daten: runStepObject
Ereignisenumeration: RunStepStreamEventCancelled
Wert | Beschreibung |
---|---|
thread.run.step.cancelled |
thread.run.step.expired
Tritt auf, wenn ein Ausführungsschritt verfällt.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | runStepObject | Stellt einen Schritt in einer Ausführung dar. |
Ja |
Daten: runStepObject
Ereignisenumeration: RunStepStreamEventExpired
Wert | Beschreibung |
---|---|
thread.run.step.expired |
messageStreamEvent
Mögliche Werte für diese Komponente:
thread.message.created
Tritt auf, wenn eine Nachricht erstellt wird.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | messageObject | Stellt eine Nachricht in einem Thread dar. | Ja |
Daten: messageObject
Ereignisenumeration: MessageStreamEventCreated
Wert | Beschreibung |
---|---|
thread.message.created |
thread.message.in_progress
Tritt auf, wenn eine Nachricht in einen Zustand vom Typ in_progress
wechselt.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | messageObject | Stellt eine Nachricht in einem Thread dar. | Ja |
Daten: messageObject
Ereignisenumeration: MessageStreamEventInProgress
Wert | Beschreibung |
---|---|
thread.message.in_progress |
thread.message.delta
Tritt auf, wenn Teile einer Nachricht gestreamt werden.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | messageDeltaObject | Stellt ein Nachrichtendelta dar (also alle Felder für eine Nachricht, die ggf. während des Streamings geändert wurden). |
Ja |
Daten: messageDeltaObject
Ereignisenumeration: MessageStreamEventDelta
Wert | Beschreibung |
---|---|
thread.message.delta |
thread.message.completed
Tritt auf, wenn eine Nachricht abgeschlossen ist.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | messageObject | Stellt eine Nachricht in einem Thread dar. | Ja |
Daten: messageObject
Ereignisenumeration: MessageStreamEventCompleted
Wert | Beschreibung |
---|---|
thread.message.completed |
thread.message.incomplete
Tritt auf, wenn eine Nachricht endet, bevor sie abgeschlossen ist.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | messageObject | Stellt eine Nachricht in einem Thread dar. | Ja |
Daten: messageObject
Ereignisenumeration: MessageStreamEventIncomplete
Wert | Beschreibung |
---|---|
thread.message.incomplete |
errorEvent
Tritt auf, wenn ein Fehler auftritt. Dies kann aufgrund eines internen Serverfehlers oder eines Timeouts eintreten.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | error | Ja |
Ereignisenumeration: ErrorEventEnum
Wert | Beschreibung |
---|---|
error |
doneEvent
Tritt auf, wenn ein Datenstrom endet.
Name | Typ | Beschreibung | Erforderlich | Standard |
---|---|---|---|---|
event | Zeichenfolge | Ja | ||
data | Zeichenfolge | Ja |
Ereignisenumeration: DoneEventEnum
Wert | Beschreibung |
---|---|
done |
Datenenumeration: DoneEventDataEnum
Wert | Beschreibung |
---|---|
[DONE] |
Nächste Schritte
Erfahren Sie mehr über Modelle und die Optimierung mit der REST-API. Erfahren Sie mehr über die zugrunde liegenden Modelle, auf denen Azure OpenAI basiert.