Compartir vía


Referencia: Incrustaciones | Inteligencia artificial de Azure Studio

Importante

Los elementos marcados (versión preliminar) en este artículo se encuentran actualmente en versión preliminar pública. Esta versión preliminar se ofrece sin acuerdo de nivel de servicio y no se recomienda para las cargas de trabajo de producción. Es posible que algunas características no sean compatibles o que tengan sus funcionalidades limitadas. Para más información, consulte Términos de uso complementarios de las Versiones Preliminares de Microsoft Azure.

Crea un vector de inserción que representa el texto de entrada.

POST /embeddings?api-version=2024-04-01-preview

Parámetros de identificador URI

Nombre En Obligatorio Type Descripción
api-version consulta True string La versión de la API con el formato "AAAA-MM-DD" o "AAAA-MM-DD-preview".

Encabezado de solicitud

Nombre Obligatorio Type Descripción
parámetros adicionales string El comportamiento de la API cuando se indican parámetros adicionales en la carga. El uso de pass-through hace que la API pase el parámetro al modelo subyacente. Use este valor cuando desee pasar parámetros que sepa que el modelo subyacente puede admitir. El uso de ignore hace que la API quite cualquier parámetro no compatible. Use este valor cuando necesite usar la misma carga en diferentes modelos, pero uno de los parámetros adicionales puede hacer que se produzca un error en un modelo si no se admite. El uso de error hace que la API rechace cualquier parámetro adicional en la carga. Solo se pueden indicar los parámetros especificados en esta API o se devuelve un error 400.
azureml-model-deployment string Nombre de la implementación a la que desea enrutar la solicitud. Compatible con puntos de conexión que admiten varias implementaciones.

Cuerpo de la solicitud

Nombre Obligatorio Type Descripción
model string Nombre del modelo. Este parámetro se omite si el punto de conexión solo sirve a un modelo.
input True string[] Texto de entrada para insertar, codificado como una cadena o matriz de tokens. Para insertar varias entradas en una sola solicitud, pase una matriz de cadenas o matriz de matrices de tokens.
dimensiones integer Número de dimensiones que deben tener las incrustaciones de salida resultantes. Devuelve un error 422 si el modelo no admite el valor o el parámetro.
encoding_format EmbeddingEncodingFormat Formato en el que se devuelven las incrustaciones. Base64, float, int8, uint8, binary o ubinary. Devuelve un error 422 si el modelo no admite el valor o el parámetro.
input-type EmbeddingInputType El tipo de la entrada. text, query o document. Devuelve un error 422 si el modelo no admite el valor o el parámetro.

Respuestas

Nombre Escribir Descripción
200 OK CreateEmbeddingResponse OK (CORRECTO)
401 No autorizado UnauthorizedError Falta el token de acceso o no es válido

encabezados

x-ms-error-code: cadena
404 No encontrado NotFoundError Modalidad no compatible con el modelo. Compruebe la documentación del modelo para ver qué rutas están disponibles.

encabezados

x-ms-error-code: cadena
422 Entidad no procesable UnprocessableContentError La solicitud contiene contenido no procesable

encabezados

x-ms-error-code: cadena
429 Demasiadas solicitudes TooManyRequestsError Ha alcanzado el límite de tasa asignado y su solicitud necesita controlarse.

encabezados

x-ms-error-code: cadena
Otros códigos de estado ContentFilterError Solicitud incorrecta

encabezados

x-ms-error-code: cadena

Seguridad

Authorization

El token con Bearer: prefix, por ejemplo, Bearer abcde12345

Tipo: apiKey In: encabezado

AADToken

Autenticación OAuth2 de Azure Active Directory

Tipo: oauth2 Flujo: aplicación URL del token: https://login.microsoftonline.com/common/oauth2/v2.0/token

Ejemplos

Crea un vector de inserción que representa el texto de entrada

Solicitud de muestra

POST /embeddings?api-version=2024-04-01-preview

{
  "input": [
    "This is a very good text"
  ],
  "input_type": "text",
  "encoding_format": "float",
  "dimensions": 1024
}

Respuesta de ejemplo

Código de estado: 200

{
  "data": [
    {
      "index": 0,
      "object": "embedding",
      "embedding": [
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0
      ]
    }
  ],
  "object": "list",
  "model": "BERT",
  "usage": {
    "prompt_tokens": 15,
    "total_tokens": 15
  }
}

Definiciones

Nombre Descripción
ContentFilterError Se produce un error en la llamada API cuando el mensaje desencadena un filtro de contenido tal como está configurado. Modifique el comando de entrada e inténtelo de nuevo.
CreateEmbeddingRequest Solicitud de creación de incrustaciones.
CreateEmbeddingResponse Respuesta de una solicitud de inserción.
Detalle Detalles de los errores.
Embedding Representa el objeto de inserción generado.
EmbeddingEncodingFormat Formato en el que se devuelven las incrustaciones. Base64, float, int8, uint8, binary o ubinary. Devuelve un error 422 si el modelo no admite el valor o el parámetro.
EmbeddingInputType El tipo de la entrada. text, query o document. Devuelve un error 422 si el modelo no admite el valor o el parámetro.
EmbeddingObject El tipo de objeto, que siempre es "embedding".
ListObject Tipo de objeto, que siempre es "list".
NotFoundError La ruta no es válida para el modelo implementado.
TooManyRequestsError Ha alcanzado el límite de tasa asignado y sus solicitudes necesitan controlarse.
UnauthorizedError Falta la autenticación o no es válida.
UnprocessableContentError La solicitud contiene contenido no procesable. El error se devuelve cuando la carga indicada es válida según esta especificación. Sin embargo, el modelo subyacente no admite algunas de las instrucciones indicadas en la carga. Use la sección details para comprender el parámetro infractor.
Uso Información de uso de la solicitud.

ContentFilterError

Se produce un error en la llamada API cuando el mensaje desencadena un filtro de contenido tal como está configurado. Modifique el comando de entrada e inténtelo de nuevo.

Nombre Escribir Descripción
código string Código de error.
error string Descripción del error.
message string El mensaje de error.
param string Parámetro que desencadenó el filtro de contenido.
status integer El código de estado HTTP.

CreateEmbeddingRequest

Solicitud de creación de incrustaciones.

Nombre Obligatorio Type Descripción
input True string[] Texto de entrada para insertar, codificado como una cadena o matriz de tokens. Para insertar varias entradas en una sola solicitud, pase una matriz de cadenas o matriz de matrices de tokens.
dimensiones integer Número de dimensiones que deben tener las incrustaciones de salida resultantes. Devuelve un error 422 si el modelo no admite el valor o el parámetro.
encoding_format EmbeddingEncodingFormat Formato en el que se devuelven las incrustaciones. Base64, float, int8, uint8, binary o ubinary. Devuelve un error 422 si el modelo no admite el valor o el parámetro.
input-type EmbeddingInputType El tipo de la entrada. text, query o document. Devuelve un error 422 si el modelo no admite el valor o el parámetro.

CreateEmbeddingResponse

Respuesta de una solicitud de inserción.

Nombre Escribir Descripción
data Embedding[] Lista de incrustaciones generadas por el modelo.
model string Nombre del modelo usado para generar la inserción.
objeto ListObject Tipo de objeto, que siempre es "list".
usada Uso Información de uso de la solicitud.

Detalle

Detalles del error UnprocessableContentError.

Nombre Escribir Descripción
loc string[] Parámetro que causa el problema
value string Valor pasado al parámetro que provoca problemas.

Embedding

Representa la inserción generada.

Nombre Escribir Descripción
insertar [] El vector de inserción. La longitud del vector depende del modelo utilizado y el tipo depende del encoding_format utilizado.
índice integer Índice de la inserción en la lista de inserciones.
objeto EmbeddingObject El tipo de objeto, que siempre es "embedding".

EmbeddingEncodingFormat

Formato en el que se devuelven las incrustaciones. Base64, float, int8, uint8, binary o ubinary. Devuelve un error 422 si el modelo no admite el valor o el parámetro.

Nombre Escribir Descripción
base64 string
binary string
flotante string
int8 string
ubinary string
uint8 string

EmbeddingInputType

El tipo de la entrada. text, query o document. Devuelve un error 422 si el modelo no admite el valor o el parámetro.

Nombre Escribir Descripción
documento string Indica que la entrada representa un documento almacenado en una base de datos vectorial.
consulta string Indica que la entrada representa una consulta de búsqueda para buscar los documentos más relevantes en la base de datos vectorial.
text string Indica que la entrada es una entrada de texto general.

EmbeddingObject

Nombre Escribir Descripción
insertar string

ListObject

Tipo de objeto, que siempre es "list".

Nombre Escribir Description
list string

NotFoundError

Nombre Escribir Descripción
error string Descripción del error.
message string El mensaje de error.
status integer El código de estado HTTP.

TooManyRequestsError

Nombre Escribir Descripción
error string Descripción del error.
message string El mensaje de error.
status integer El código de estado HTTP.

UnauthorizedError

Nombre Escribir Descripción
error string Descripción del error.
message string El mensaje de error.
status integer El código de estado HTTP.

UnprocessableContentError

La solicitud contiene contenido no procesable. El error se devuelve cuando la carga indicada es válida según esta especificación. Sin embargo, el modelo subyacente no admite algunas de las instrucciones indicadas en la carga. Use la sección details para comprender el parámetro infractor.

Nombre Escribir Descripción
código string Código de error.
detalles Detalle
error string Descripción del error.
message string El mensaje de error.
status integer El código de estado HTTP.

Uso

Información de uso de la solicitud.

Nombre Escribir Descripción
prompt_tokens integer El número de tokens usados por la solicitud.
total_tokens integer El número total de tokens usados por la solicitud.