在 SharePoint Server 中添加、编辑或删除内容源
适用于:2013 2016 2019 Subscription Edition SharePoint in Microsoft 365
内容源 是一组选项,可用于指定爬网的内容、时间和方式。
创建搜索服务应用程序时,将自动创建名为“本地 SharePoint 网站”的内容源,并将其配置为在本地服务器场中爬网所有 SharePoint Server 网站。 您可以创建附加内容源来指定要爬网的其他内容以及系统应如何对该内容进行爬网。 创建内容源后,可以随时进行编辑或删除。
警告
更改内容源需要对该内容源进行完全爬网。
开始之前
在开始此操作之前,请参阅以下文章,了解有关创建内容源的先决条件的信息:
创建、编辑或删除内容源
获取“管理内容源”页
确认执行此过程的用户帐户是 Search Service 应用程序的管理员。
在 SharePoint Server 管理中心主页上,导航到 “应用程序管理 > 管理服务应用程序” > “搜索服务应用程序”。
在 “搜索管理 ”页上的“ 爬网”下,选择“ 内容源”。
创建内容源
在“管理内容源”页上,选择“新建内容源”。
在 “添加内容源 ”页上的“ 名称”下,在“名称”框中键入新内容源 的名称 。
在“ 内容源类型”下,选择要爬网的内容类型。
在“ 开始地址”下,在“键入起始地址”框中,键入爬网程序应从其开始爬网的 URL , (每行) 一个 。
在 “爬网设置”下,选择所需的爬网行为。
在 “爬网计划”下,若要指定完全爬网的计划,请从“ 完全爬网 ”列表中选择定义的计划。 完全爬网涉及对内容源指定的所有内容进行爬网,而不管内容是否已更改。 若要定义完全爬网计划,请选择“创建计划”。
若要为增量爬网指定计划,请从“增量爬网”列表中选择定义的计划。 增量爬网涉及对自上次爬网以来已更改的内容源指定的内容进行爬网。 若要定义计划,请选择“创建计划”。 可以通过选择 “编辑计划”来更改定义的计划。
注意
对于 SharePoint Server 网站类型的内容源,可以启用连续爬网。 有关详细信息,请参阅Manage continuous crawls in SharePoint Server。
若要设置此内容源的优先级,请在“内容源优先级”下,从“优先级”列表中选择“普通”或“高”。
选择“确定”。
编辑内容源
可以编辑内容源,以更改对此内容进行爬网的计划、爬网开始地址、内容源优先级或爬网名称。 编辑内容源时不能更改爬网设置和内容源类型。
在 “管理内容源 ”页上的内容源列表中,指向要编辑的内容源的名称,单击出现的箭头,然后选择“ 编辑”。
进行所需的更改后,选择“ 确定”。
删除内容源
在 “管理内容源 ”页上的内容源列表中,指向要删除的内容源的名称,单击出现的箭头,然后选择“ 删除”。
选择“ 确定” 以确认要删除此内容源。
从 SharePoint Server 订阅版本 23H2 功能更新开始,你可以配置应用程序用于搜索内容源的 HTTP 协议版本。
注意
默认情况下,搜索服务应用程序搜索爬网程序使用 HTTP 1.1 协议版本。 搜索爬网程序会在配置时使用 HTTP 1.0 协议版本。
可以将 HTTP 协议版本配置为适用于特定内容源。 只能使用以下 cmdlet 配置这些 HTTP 协议版本:
- New-SPEnterpriseSearchCrawlContentSource
- Set-SPEnterpriseSearchCrawlContentSource
使用这些 PowerShell cmdlet 时,可以使用以下选项指定 HttpProtocol
参数:
- 默认值:此选项引用系统默认选项,当前为 HTTP 1.1。
- Http_1_0:此选项指 HTTP 1.0 协议。
- Http_1_1:此选项指 HTTP 1.1 协议。