你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure AI Foundry 模型目录矢量化器
重要
根据补充使用条款,此向量器以公共预览版提供。 2024-05-01-Preview REST API 支持此功能。
Azure AI Foundry 模型目录向量器连接到通过 Azure AI Foundry 模型目录部署到Azure 机器学习终结点的嵌入模型。 数据在部署模型的地理位置进行处理。
如果使用集成矢量化来创建矢量数组,技能集应包含指向 Azure AI Foundry 门户中模型目录的 AML 技能。
矢量器参数
参数区分大小写。 选择使用哪些参数取决于 AML 联机终结点所需的身份验证(如果有)。
参数名称 | 说明 |
---|---|
uri |
(必需)JSON 有效负载发送到的 AML 联机终结点的 URI。 仅支持 https URI 方案。 |
modelName |
(必需)在提供的终结点上部署的 Azure AI Foundry 模型目录中的模型 ID。 支持的模型为:
|
key |
(密钥身份验证所需)AML 联机终结点的密钥。 |
resourceId |
(令牌身份验证需要)。 AML 联机终结点的 Azure 资源管理器资源 ID。 它的格式应如下所示:subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name}。 |
region |
(对于令牌身份验证可选)。 AML 联机终结点部署到的区域。 如果区域与搜索服务的区域不同,则需要提供区域。 |
timeout |
(可选)如果指定,表明执行 API 调用的 http 客户端的超时值。 必须将其格式化为 XSD“dayTimeDuration”值(ISO 8601 持续时间值的受限子集)。 例如,PT60S 表示 60 秒。 如果未设置,选择的是默认值 30 秒。 超时可以设置为最大 230 秒和最小 1 秒。 |
要使用的身份验证参数
需要哪些身份验证参数取决于 AML 联机终结点使用的身份验证(如果有)。 AML 联机终结点提供两个身份验证选项:
- 基于密钥的身份验证。 提供静态密钥,对来自矢量器的评分请求进行身份验证。
- 使用 uri 和 key 参数
- 基于令牌的身份验证。 使用基于令牌的身份验证来部署 AML 联机终结点。 必须启用 Azure AI 搜索服务的托管标识。 然后,矢量器使用服务的托管标识向 AML 联机终结点进行身份验证,无需任何静态密钥。 必须为该标识分配所有者或参与者角色。
- 使用 resourceId 参数。
- 如果搜索服务与 AML 工作区位于不同的区域,请使用 region 参数设置 AML 联机终结点已部署到的区域
支持的矢量查询类型
Azure AI Foundry 模型目录向量器支持哪些矢量查询类型取决于 modelName
配置的。
嵌入模型 | 支持 text 查询 |
支持 imageUrl 查询 |
支持 imageBinary 查询 |
---|---|---|---|
Facebook-DinoV2-Image-Embeddings-ViT-Base | X | X | |
Facebook-DinoV2-Image-Embeddings-ViT-Giant | X | X | |
Cohere-embed-v3-english | X | ||
Cohere-embed-v3-multilingual | X |
预期字段维度
使用 Azure AI Foundry 模型目录向量器配置的字段的预期字段维度取决于 modelName
配置的字段。
modelName |
预期维度 |
---|---|
Facebook-DinoV2-Image-Embeddings-ViT-Base | 768 |
Facebook-DinoV2-Image-Embeddings-ViT-Giant | 1536 |
Cohere-embed-v3-english | 1024 |
Cohere-embed-v3-multilingual | 1024 |
示例定义
Azure AI Foundry 模型目录中的建议模型名称由基本模型加上随机三字母后缀组成。 模型的名称将与本示例中所示的名称不同。
"vectorizers": [
{
"name": "my-model-catalog-vectorizer",
"kind": "aml",
"amlParameters": {
"uri": "https://Cohere-embed-v3-multilingual-hin.eastus.models.ai.azure.com",
"key": "aaaaaaaa-0b0b-1c1c-2d2d-333333333333",
"timeout": "PT60S",
"modelName": "Cohere-embed-v3-multilingual-hin",
"resourceId": null,
"region": null,
},
}
]