Compartir vía


Vectorizador de catálogo de modelos de Azure AI Foundry

Importante

Este vectorizador está en versión preliminar pública en Términos de uso complementarios. La API de REST 2024-05-01-versión preliminar admite esta característica.

El vectorizador de catálogo de modelos de Azure AI Foundry se conecta a un modelo de inserción que se implementó a través del catálogo de modelos de Azure AI Foundry en un punto de conexión de Azure Machine Learning. Los datos se procesan en la ubicación geográfica en la que se implementa el modelo.

Si ha usado la vectorización integrada para crear las matrices de vectores, el conjunto de aptitudes debe incluir una aptitud de AML que apunte al catálogo de modelos en el portal de Azure AI Foundry.

Parámetros de vectorizador

Los parámetros distinguen mayúsculas de minúsculas. Los parámetros que decida usar dependen de la autenticación que requiera el punto de conexión en línea de AML, si es que requiere alguna.

Nombre de parámetro Descripción
uri (Obligatorio) URI del punto de conexión en línea de AML al que se envía la carga JSON. Solo se permite el esquema de URI https.
modelName (Obligatorio) Identificador de modelo del catálogo de modelos de Azure AI Foundry que se implementa en el punto de conexión proporcionado. Los modelos admitidos son:
  • Facebook-DinoV2-Image-Embeddings-ViT-Base
  • Facebook-DinoV2-Image-Embeddings-ViT-Giant
  • Cohere-embed-v3-english
  • Cohere-embed-v3-multilingual
key (Se requiere para la autenticación de clave) La clave del punto de conexión en línea de AML.
resourceId (Necesario para la autenticación de tokens). El identificador de recursos de Azure Resource Manager del punto de conexión en línea de AML. Debería estar en el formato subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{nombre-área-trabajo}/onlineendpoints/{nombre-punto-de-conexión}.
region (Opcional para la autenticación de tokens). La región en la que se implementa el punto de conexión en línea de AML. Es necesario si la región es diferente de la región del servicio de búsqueda.
timeout (Opcional) Cuando se especifica, indica el tiempo de expiración del cliente http que hace la llamada API. Debe tener el formato de un valor "dayTimeDuration" XSD (subconjunto restringido de un valor de duración ISO 8601 ). Por ejemplo, PT60S para 60 segundos. Si no se establece, se elige el valor predeterminado de 30 segundos. El tiempo de expiración se puede establecer en un máximo de 230 segundos y un mínimo de 1.

Qué parámetros de autenticación se van a usar

Los parámetros de autenticación necesarios dependen de la autenticación que use el punto de conexión en línea de AML, si es que usa alguna. Los puntos de conexión en línea de AML proporcionan dos opciones de autenticación:

  • Autenticación basada en claves Se proporciona una clave estática para autenticar las solicitudes de puntuación del vectorizador.
    • Use los parámetros uri y key.
  • Autenticación basada en tokens El punto de conexión en línea de AML se implementa mediante la autenticación basada en tokens. La identidad administrada del servicio de Azure AI Search debe estar habilitada. A continuación, el vectorizador usa la identidad administrada del servicio para autenticarse en el punto de conexión en línea de AML, sin que se necesiten claves estáticas. La identidad debe tener asignado el rol de propietario o colaborador.
    • Use el parámetro resourceId.
    • Si el servicio de búsqueda está en una región diferente del área de trabajo de AML, use el parámetro región para establecer la región en la que se implementó el punto de conexión en línea de AML

Tipos de consulta vectorial admitidos

Qué tipos de consulta vectoriales son compatibles con el vectorizador del catálogo de modelos de Azure AI Foundry depende del modelName que esté configurado.

Modelo de inserción Admite la consulta text Admite la consulta imageUrl Admite la consulta imageBinary
Facebook-DinoV2-Image-Embeddings-ViT-Base X X
Facebook-DinoV2-Image-Embeddings-ViT-Giant X X
Cohere-embed-v3-english X
Cohere-embed-v3-multilingual X

Dimensiones de campo esperadas

Las dimensiones de campo esperadas para un campo configurado con un vectorizador de catálogo de modelos de Azure AI Foundry dependen del modelName que está configurado.

modelName Dimensiones esperadas
Facebook-DinoV2-Image-Embeddings-ViT-Base 768
Facebook-DinoV2-Image-Embeddings-ViT-Giant 1536
Cohere-embed-v3-english 1024
Cohere-embed-v3-multilingual 1024

Definición de ejemplo

Los nombres de modelo sugeridos en el catálogo de modelos de Azure AI Foundry constan del modelo base más un sufijo aleatorio de tres letras. El nombre del modelo será diferente del que se muestra en este ejemplo.

"vectorizers": [
    {
        "name": "my-model-catalog-vectorizer",
        "kind": "aml",
        "amlParameters": {
            "uri": "https://Cohere-embed-v3-multilingual-hin.eastus.models.ai.azure.com",
            "key": "aaaaaaaa-0b0b-1c1c-2d2d-333333333333",
            "timeout": "PT60S",
            "modelName": "Cohere-embed-v3-multilingual-hin",
            "resourceId": null,
            "region": null,
        },
    }
]

Consulte también