在复制活动中配置 Azure AI 搜索

本文概述了如何使用数据管道中的复制活动向 Azure AI 搜索复制数据。

支持的配置

有关复制活动下每个选项卡的配置,请分别转到以下各部分。

常规

若要配置“常规”设置选项卡,请参阅常规”设置指导。

目标

复制活动的“目标”选项卡下的 Azure AI 搜索支持以下属性。

显示“目标”选项卡的屏幕截图。

需要以下属性:

  • 连接:从连接列表中选择 Azure AI 搜索数据库连接。 如果不存在连接,请创建新的 Azure AI 搜索连接。
  • 索引名称:选择搜索索引的名称。 此服务不创建索引。 索引必须存在于 Azure AI 搜索中。

在“高级”下,可以指定以下字段:

  • 索引操作:指定索引中已存在文档时要合并还是替换该文档。 可以选择“合并”或“上传”。

    屏幕截图显示“索引操作”选项卡。

    • 合并:合并新文档和现有文档中的所有列。 如果没有现有文档,则新文档将作为新文档上传到索引。

    • 上传:新文档替换现有文档。 如果没有现有文档,则新文档将作为新文档上传到索引。

  • 写入批大小:当缓冲区大小达到指定的写入批大小时,数据将上传到搜索索引中。 允许的值为:整数 1 到 1,000;默认值为 1000。
    Azure AI 搜索服务支持成批编写文档。 每批次可包含 1 到 1,000 个操作。 每个操作处理一个文档以执行上传/合并操作。

  • 最大并发连接:指定活动运行期间与数据存储建立的并发连接的上限。 仅在要限制并发连接时指定一个值。

映射

对于“映射”选项卡配置,请参阅“映射”选项卡下的“配置映射”

设置

对于“设置”选项卡配置,请转到“设置”选项卡下的“配置其他设置”

表摘要

下表包含有关 Azure AI 搜索中复制活动的详细信息。

目标信息

名称 描述 必选 JSON 脚本属性
Connection 与目标数据存储的连接。 < Azure AI 搜索连接 > 连接
索引名称 搜索索引的名称。 此服务不创建索引。 索引必须存在于 Azure AI 搜索中。 < 搜索索引名称 > indexName
索引操作 指定索引中已存在文档时要合并还是替换该文档。
允许的值为:Merge(默认)和Upload
• 合并
• 上传
indexAction:
• merge
• 上传
写入批大小 当缓冲区大小达到指定的写入批大小时,数据会上传到搜索索引中。 整数 1 到 1,000
默认值为 1000
writeBatchSize
最大并发连接数 活动运行期间与数据存储建立的并发连接的上限。 <并发连接的上限>
(整数)
maxConcurrentConnections