你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure AI Foundry 模型目录矢量化器

重要

根据补充使用条款,此向量器以公共预览版提供。 2024-05-01-Preview REST API 支持此功能。

Azure AI Foundry 模型目录向量器连接到通过 Azure AI Foundry 模型目录部署到Azure 机器学习终结点的嵌入模型。 数据在部署模型的地理位置进行处理。

如果使用集成矢量化来创建矢量数组,技能集应包含指向 Azure AI Foundry 门户中模型目录的 AML 技能。

矢量器参数

参数区分大小写。 选择使用哪些参数取决于 AML 联机终结点所需的身份验证(如果有)

参数名称 说明
uri (必需)JSON 有效负载发送到的 AML 联机终结点的 URI 仅支持 https URI 方案。
modelName (必需)在提供的终结点上部署的 Azure AI Foundry 模型目录中的模型 ID。 支持的模型为:
  • Facebook-DinoV2-Image-Embeddings-ViT-Base
  • Facebook-DinoV2-Image-Embeddings-ViT-Giant
  • Cohere-embed-v3-english
  • Cohere-embed-v3-multilingual
key 密钥身份验证所需)AML 联机终结点的密钥
resourceId 令牌身份验证需要)。 AML 联机终结点的 Azure 资源管理器资源 ID。 它的格式应如下所示:subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name}。
region (对于令牌身份验证可选)。 AML 联机终结点部署到的区域。 如果区域与搜索服务的区域不同,则需要提供区域。
timeout (可选)如果指定,表明执行 API 调用的 http 客户端的超时值。 必须将其格式化为 XSD“dayTimeDuration”值(ISO 8601 持续时间值的受限子集)。 例如,PT60S 表示 60 秒。 如果未设置,选择的是默认值 30 秒。 超时可以设置为最大 230 秒和最小 1 秒。

要使用的身份验证参数

需要哪些身份验证参数取决于 AML 联机终结点使用的身份验证(如果有)。 AML 联机终结点提供两个身份验证选项:

  • 基于密钥的身份验证。 提供静态密钥,对来自矢量器的评分请求进行身份验证。
    • 使用 uri 和 key 参数
  • 基于令牌的身份验证使用基于令牌的身份验证来部署 AML 联机终结点。 必须启用 Azure AI 搜索服务的托管标识。 然后,矢量器使用服务的托管标识向 AML 联机终结点进行身份验证,无需任何静态密钥。 必须为该标识分配所有者或参与者角色。
    • 使用 resourceId 参数。
    • 如果搜索服务与 AML 工作区位于不同的区域,请使用 region 参数设置 AML 联机终结点已部署到的区域

支持的矢量查询类型

Azure AI Foundry 模型目录向量器支持哪些矢量查询类型取决于 modelName 配置的。

嵌入模型 支持 text 查询 支持 imageUrl 查询 支持 imageBinary 查询
Facebook-DinoV2-Image-Embeddings-ViT-Base X X
Facebook-DinoV2-Image-Embeddings-ViT-Giant X X
Cohere-embed-v3-english X
Cohere-embed-v3-multilingual X

预期字段维度

使用 Azure AI Foundry 模型目录向量器配置的字段的预期字段维度取决于 modelName 配置的字段。

modelName 预期维度
Facebook-DinoV2-Image-Embeddings-ViT-Base 768
Facebook-DinoV2-Image-Embeddings-ViT-Giant 1536
Cohere-embed-v3-english 1024
Cohere-embed-v3-multilingual 1024

示例定义

Azure AI Foundry 模型目录中的建议模型名称由基本模型加上随机三字母后缀组成。 模型的名称将与本示例中所示的名称不同。

"vectorizers": [
    {
        "name": "my-model-catalog-vectorizer",
        "kind": "aml",
        "amlParameters": {
            "uri": "https://Cohere-embed-v3-multilingual-hin.eastus.models.ai.azure.com",
            "key": "aaaaaaaa-0b0b-1c1c-2d2d-333333333333",
            "timeout": "PT60S",
            "modelName": "Cohere-embed-v3-multilingual-hin",
            "resourceId": null,
            "region": null,
        },
    }
]

另请参阅