Referens: Inbäddningar | Azure AI Foundry
Viktigt!
Objekt markerade (förhandsversion) i den här artikeln är för närvarande i offentlig förhandsversion. Den här förhandsversionen tillhandahålls utan ett serviceavtal och vi rekommenderar det inte för produktionsarbetsbelastningar. Vissa funktioner kanske inte stöds eller kan vara begränsade. Mer information finns i Kompletterande villkor för användning av Microsoft Azure-förhandsversioner.
Skapar en inbäddningsvektor som representerar indatatexten.
POST /embeddings?api-version=2024-05-01-preview
URI-parametrar
Name | I | Obligatoriskt | Type | Beskrivning |
---|---|---|---|---|
api-version |
query | Sant | sträng | Versionen av API:et i formatet "ÅÅÅÅ-MM-DD" eller "ÅÅÅÅ-MM-DD-preview". |
Begärandehuvud
Namn | Obligatoriskt | Type | Beskrivning |
---|---|---|---|
extraparametrar | sträng | Beteendet för API:et när extra parametrar anges i nyttolasten. Med gör pass-through api:et att skicka parametern till den underliggande modellen. Använd det här värdet när du vill skicka parametrar som du vet att den underliggande modellen kan stödja. Med hjälp av drop får API:et att släppa valfri parameter som inte stöds. Använd det här värdet när du behöver använda samma nyttolast i olika modeller, men en av de extra parametrarna kan göra att en modell felar ut om den inte stöds. Api error :et används för att avvisa eventuella extra parametrar i nyttolasten. Endast parametrar som anges i det här API:et kan anges eller så returneras ett 400-fel. |
|
azureml-model-deployment | sträng | Namnet på den distribution som du vill dirigera begäran till. Stöds för slutpunkter som stöder flera distributioner. |
Begärandetext
Namn | Obligatoriskt | Type | Beskrivning |
---|---|---|---|
modell | sträng | Modellnamnet. Den här parametern ignoreras om slutpunkten endast hanterar en modell. | |
indata | Sant | string[] | Indatatext som ska bäddas in, kodas som en sträng eller matris med token. Om du vill bädda in flera indata i en enda begäran skickar du en matris med strängar eller matriser med tokenmatriser. |
dimensioner | integer | Antalet dimensioner som resulterande inbäddningar av utdata ska ha. Returnerar ett 422-fel om modellen inte stöder värdet eller parametern. | |
encoding_format | EmbeddingEncodingFormat | Formatet för att returnera inbäddningarna i. Antingen base64, float, int8, uint8, binary eller ubinary. Returnerar ett 422-fel om modellen inte stöder värdet eller parametern. | |
input_type | EmbeddingInputType | Typ av indata. Antingen text , query eller document . Returnerar ett 422-fel om modellen inte stöder värdet eller parametern. |
Svar
Namn | Type | Beskrivning |
---|---|---|
200 OK | CreateEmbeddingResponse | OK |
401 – Ej behörig | UnauthorizedError | Åtkomsttoken saknas eller är ogiltig Sidhuvuden x-ms-error-code: string |
404 – Hittades inte | NotFoundError | Modalitet stöds inte av modellen. Kontrollera dokumentationen för modellen för att se vilka vägar som är tillgängliga. Sidhuvuden x-ms-error-code: string |
422 Entitet som inte kan bearbetas | UnprocessableContentError | Begäran innehåller oförbearbetat innehåll Sidhuvuden x-ms-error-code: string |
429 För många förfrågningar | TooManyRequestsError | Du har nått den tilldelade hastighetsgränsen och din begäran måste ökas i takt. Sidhuvuden x-ms-error-code: string |
Andra statuskoder | ContentFilterError | Felaktig begäran Sidhuvuden x-ms-error-code: string |
Säkerhet
Auktorisering
Token med Bearer: prefix
, t.ex. Bearer abcde12345
Typ: apiKey I: header
AADToken
Azure Active Directory OAuth2-autentisering
Typ: oauth2 Flow: url för programtoken:https://login.microsoftonline.com/common/oauth2/v2.0/token
Exempel
Skapar en inbäddningsvektor som representerar indatatexten
Exempelförfrågan
POST /embeddings?api-version=2024-04-01-preview
{
"input": [
"This is a very good text"
],
"input_type": "text",
"encoding_format": "float",
"dimensions": 1024
}
Exempelsvar
Statuskod: 200
{
"data": [
{
"index": 0,
"object": "embedding",
"embedding": [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
]
}
],
"object": "list",
"model": "BERT",
"usage": {
"prompt_tokens": 15,
"total_tokens": 15
}
}
Definitioner
Name | beskrivning |
---|---|
ContentFilterError | API-anropet misslyckas när kommandotolken utlöser ett innehållsfilter som konfigurerats. Ändra kommandotolken och försök igen. |
CreateEmbeddingRequest | Begäran om att skapa inbäddningar. |
CreateEmbeddingResponse | Svar från en inbäddningsbegäran. |
Detalj | Information om felen. |
Inbäddning | Representerar det inbäddningsobjekt som genererats. |
EmbeddingEncodingFormat | Formatet för att returnera inbäddningarna i. Antingen base64, float, int8, uint8, binary eller ubinary. Returnerar ett 422-fel om modellen inte stöder värdet eller parametern. |
EmbeddingInputType | Typ av indata. Antingen text , query eller document . Returnerar ett 422-fel om modellen inte stöder värdet eller parametern. |
EmbeddingObject | Objekttypen, som alltid är "inbäddning". |
ListObject | Objekttypen, som alltid är "lista". |
NotFoundError | Vägen är inte giltig för den distribuerade modellen. |
TooManyRequestsError | Du har nått din tilldelade hastighetsgräns och dina begäranden måste ökas i takt. |
UnauthorizedError | Autentisering saknas eller är ogiltig. |
UnprocessableContentError | Begäran innehåller oförbearbetat innehåll. Felet returneras när nyttolasten som anges är giltig enligt den här specifikationen. Vissa av instruktionerna som anges i nyttolasten stöds dock inte av den underliggande modellen. Använd avsnittet details för att förstå den felande parametern. |
Användning | Användningsinformationen för begäran. |
ContentFilterError
API-anropet misslyckas när kommandotolken utlöser ett innehållsfilter som konfigurerats. Ändra kommandotolken och försök igen.
Namn | Type | Beskrivning |
---|---|---|
kod | sträng | Felkoden. |
fel | sträng | Felbeskrivningen. |
meddelande | sträng | Felmeddelandet. |
Param | sträng | Parametern som utlöste innehållsfiltret. |
status | integer | HTTP-statuskoden. |
CreateEmbeddingRequest
Begäran om att skapa inbäddningar.
Namn | Obligatoriskt | Type | Beskrivning |
---|---|---|---|
indata | Sant | string[] | Indatatext som ska bäddas in, kodas som en sträng eller matris med token. Om du vill bädda in flera indata i en enda begäran skickar du en matris med strängar eller matriser med tokenmatriser. |
dimensioner | integer | Antalet dimensioner som resulterande inbäddningar av utdata ska ha. Returnerar ett 422-fel om modellen inte stöder värdet eller parametern. | |
encoding_format | EmbeddingEncodingFormat | Formatet för att returnera inbäddningarna i. Antingen base64, float, int8, uint8, binary eller ubinary. Returnerar ett 422-fel om modellen inte stöder värdet eller parametern. | |
input_type | EmbeddingInputType | Typ av indata. Antingen text , query eller document . Returnerar ett 422-fel om modellen inte stöder värdet eller parametern. |
CreateEmbeddingResponse
Svar från en inbäddningsbegäran.
Namn | Type | Beskrivning |
---|---|---|
data | Bädda in[] | Listan över inbäddningar som genereras av modellen. |
modell | sträng | Namnet på den modell som används för att generera inbäddningen. |
objekt | ListObject | Objekttypen, som alltid är "lista". |
användning | Användning | Användningsinformationen för begäran. |
Detalj
Information om felet UnprocessableContentError .
Namn | Type | Beskrivning |
---|---|---|
Loc | string[] | Parametern som orsakar problemet |
värde | sträng | Värdet som skickas till parametern som orsakar problem. |
Inbäddning
Representerar den inbäddning som genererats.
Namn | Type | Beskrivning |
---|---|---|
inbäddning | [] | Inbäddningsvektorn. Längden på vektorn beror på vilken modell som används och typen beror på vilken typ som encoding_format används. |
index | integer | Indexet för inbäddningen i listan över inbäddningar. |
objekt | EmbeddingObject | Objekttypen, som alltid är "inbäddning". |
EmbeddingEncodingFormat
Formatet för att returnera inbäddningarna i. Antingen base64, float, int8, uint8, binary eller ubinary. Returnerar ett 422-fel om modellen inte stöder värdet eller parametern.
Namn | Type | Beskrivning |
---|---|---|
base64 | sträng | |
binary | sträng | |
flyttal | sträng | |
int8 | sträng | |
ubinary | sträng | |
uint8 | sträng |
EmbeddingInputType
Typ av indata. Antingen text
, query
eller document
. Returnerar ett 422-fel om modellen inte stöder värdet eller parametern.
Namn | Type | Beskrivning |
---|---|---|
dokument | sträng | Anger att indata representerar ett dokument som lagras i en vektordatabas. |
query | sträng | Anger att indata representerar en sökfrågor för att hitta de mest relevanta dokumenten i vektordatabasen. |
text | sträng | Anger att indata är en allmän textinmatning. |
EmbeddingObject
Namn | Type | Beskrivning |
---|---|---|
inbäddning | sträng |
ListObject
Objekttypen, som alltid är "lista".
Namn | Type | Description |
---|---|---|
lista | sträng |
NotFoundError
Namn | Type | Beskrivning |
---|---|---|
fel | sträng | Felbeskrivningen. |
meddelande | sträng | Felmeddelandet. |
status | integer | HTTP-statuskoden. |
TooManyRequestsError
Namn | Type | Beskrivning |
---|---|---|
fel | sträng | Felbeskrivningen. |
meddelande | sträng | Felmeddelandet. |
status | integer | HTTP-statuskoden. |
UnauthorizedError
Namn | Type | Beskrivning |
---|---|---|
fel | sträng | Felbeskrivningen. |
meddelande | sträng | Felmeddelandet. |
status | integer | HTTP-statuskoden. |
UnprocessableContentError
Begäran innehåller oförbearbetat innehåll. Felet returneras när nyttolasten som anges är giltig enligt den här specifikationen. Vissa av instruktionerna som anges i nyttolasten stöds dock inte av den underliggande modellen. Använd avsnittet details
för att förstå den felande parametern.
Namn | Type | Beskrivning |
---|---|---|
kod | sträng | Felkoden. |
detalj | Detalj | |
fel | sträng | Felbeskrivningen. |
meddelande | sträng | Felmeddelandet. |
status | integer | HTTP-statuskoden. |
Förbrukning
Användningsinformationen för begäran.
Namn | Type | Beskrivning |
---|---|---|
prompt_tokens | integer | Antalet token som används av prompten. |
total_tokens | integer | Det totala antalet token som används av begäran. |