Vectorizador de Azure OpenAI
El vectorizador de Azure OpenAI se conecta a un modelo de inserción implementado en el recurso de Azure OpenAI para generar inserciones en el momento de la consulta. Los datos se procesan en la ubicación geográfica en la que se implementa el modelo.
Los vectorizadores se usan en el momento de la consulta, pero se especifican en definiciones de índice y se hace referencia a los campos vectoriales a través de un perfil de vector. Se llama AzureOpenAIVectorizer
al vectorizador OpenAI de Azure en la API.
Use la API REST 2024-07-01 o un paquete de Azure SDK que se ha actualizado para proporcionar la característica.
La configuración de un vectorizador en un índicede búsqueda proporciona instrucciones de uso.
Nota:
Este vectorizador está enlazado a Azure OpenAI y se cobra según el precio de pago por uso de Azure OpenAI existente.
Requisitos previos
El servicio Azure OpenAI debe tener un subdominio personalizado asociado. Si el servicio se creó a través de Azure Portal, este subdominio se genera automáticamente como parte de la configuración del servicio. Asegúrese de que el servicio incluye un subdominio personalizado antes de usarlo con la integración de la Búsqueda de Azure AI.
No se admiten los recursos del servicio OpenAI de Azure (con acceso a los modelos de inserción) creados en el portal de Azure AI Foundry. Solo los recursos de Azure OpenAI Service creados en Azure Portal son compatibles con la integración de aptitudes de Incrustación de Azure OpenAI.
Parámetros de vectorizador
Los parámetros distinguen mayúsculas de minúsculas.
Nombre de parámetro | Descripción |
---|---|
resourceUri |
El URI del proveedor de modelos, en este caso, un recurso de Azure OpenAI. Este parámetro solo admite direcciones URL con dominio openai.azure.com , como https://<resourcename>.openai.azure.com . Si el punto de conexión de Azure OpenAI tiene una dirección URL con el dominio cognitiveservices.azure.com , como https://<resourcename>.cognitiveservices.azure.com , se debe crear primero un subdominio personalizado con openai.azure.com para el recurso de Azure OpenAI y usarlo https://<resourcename>.openai.azure.com en su lugar. |
apiKey |
Clave secreta que se usa para acceder al modelo. Si proporciona una clave, deje authIdentity vacío. Si establece apiKey y authIdentity , apiKey se usa en la conexión. |
deploymentId |
El nombre del modelo de inserción de Azure OpenAI implementado. El modelo debe ser un modelo de inserción, como text-embeding-ada-002. Consulte la lista de modelos de Azure OpenAI para ver los modelos admitidos. |
authIdentity |
Una identidad administrada por el usuario que usa el servicio de búsqueda para conectarse a Azure OpenAI. Puede usar una identidad administrada por el usuario o por el sistema. Para usar una identidad administrada del sistema, deje apiKey y authIdentity en blanco. La identidad administrada por el sistema se usa automáticamente. Una identidad administrada debe tener permisos de usuario de OpenAI de Cognitive Services para enviar texto a Azure OpenAI. |
modelName |
Obligatorio en la versión de API 2024-05-01-Preview y versiones posteriores. Nombre del modelo de inserción de Azure OpenAI que se implementa en los valores proporcionados resourceUri y deploymentId . Actualmente, los valores admitidos son text-embedding-ada-002 , text-embedding-3-large y text-embedding-3-small . |
Tipos de consulta vectorial admitidos
El vectorizador de Azure OpenAI solo admite text
consultas vectoriales.
Dimensiones de campo esperadas
Las dimensiones de campo esperadas para un campo configurado con un vectorizador de Azure OpenAI dependen del modelName
que esté configurado.
modelName |
Dimensiones mínimas | Dimensiones máximas |
---|---|---|
text-embedding-ada-002 | 1536 | 1536 |
text-embedding-3-large | 1 | 3072 |
text-embedding-3-small | 1 | 1536 |
Definición de ejemplo
"vectorizers": [
{
"name": "my-openai-vectorizer",
"kind": "azureOpenAI",
"azureOpenAIParameters": {
"resourceUri": "https://my-fake-azure-openai-resource.openai.azure.com",
"apiKey": "0000000000000000000000000000000000000",
"deploymentId": "my-ada-002-deployment",
"authIdentity": null,
"modelName": "text-embedding-ada-002",
},
}
]