在复制活动中配置 Azure AI 搜索
本文概述了如何使用数据管道中的复制活动向 Azure AI 搜索复制数据。
支持的配置
有关复制活动下每个选项卡的配置,请分别转到以下各部分。
常规
若要配置“常规”设置选项卡,请参阅“常规”设置指导。
目标
复制活动的“目标”选项卡下的 Azure AI 搜索支持以下属性。
需要以下属性:
- 连接:从连接列表中选择 Azure AI 搜索数据库连接。 如果不存在连接,请创建新的 Azure AI 搜索连接。
- 索引名称:选择搜索索引的名称。 此服务不创建索引。 索引必须存在于 Azure AI 搜索中。
在“高级”下,可以指定以下字段:
索引操作:指定索引中已存在文档时要合并还是替换该文档。 可以选择“合并”或“上传”。
合并:合并新文档和现有文档中的所有列。 如果没有现有文档,则新文档将作为新文档上传到索引。
上传:新文档替换现有文档。 如果没有现有文档,则新文档将作为新文档上传到索引。
写入批大小:当缓冲区大小达到指定的写入批大小时,数据将上传到搜索索引中。 允许的值为:整数 1 到 1,000;默认值为 1000。
Azure AI 搜索服务支持成批编写文档。 每批次可包含 1 到 1,000 个操作。 每个操作处理一个文档以执行上传/合并操作。最大并发连接:指定活动运行期间与数据存储建立的并发连接的上限。 仅在要限制并发连接时指定一个值。
映射
对于“映射”选项卡配置,请参阅“映射”选项卡下的“配置映射”。
设置
对于“设置”选项卡配置,请转到“设置”选项卡下的“配置其他设置”。
表摘要
下表包含有关 Azure AI 搜索中复制活动的详细信息。
目标信息
名称 | 描述 | 值 | 必选 | JSON 脚本属性 |
---|---|---|---|---|
Connection | 与目标数据存储的连接。 | < Azure AI 搜索连接 > | 是 | 连接 |
索引名称 | 搜索索引的名称。 此服务不创建索引。 索引必须存在于 Azure AI 搜索中。 | < 搜索索引名称 > | 是 | indexName |
索引操作 | 指定索引中已存在文档时要合并还是替换该文档。 允许的值为:Merge(默认)和Upload。 |
• 合并 • 上传 |
否 | indexAction: • merge • 上传 |
写入批大小 | 当缓冲区大小达到指定的写入批大小时,数据会上传到搜索索引中。 | 整数 1 到 1,000 默认值为 1000 |
否 | writeBatchSize |
最大并发连接数 | 活动运行期间与数据存储建立的并发连接的上限。 | <并发连接的上限> (整数) |
否 | maxConcurrentConnections |