阶段 4: 设置搜索并启用您在 SharePoint 服务器的目录内容进行爬网

适用于:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint in Microsoft 365

注意

本系列中所述的许多功能也适用于 Microsoft 365 中的 SharePoint 中的大多数网站。

快速概览

阶段 3:如何在 SharePoint Server 中启用目录中所述, 产品 列表现已启用为目录。 As we'll be using search technology to retrieve and display content on our publishing site (the Contoso website), we have to crawl the catalog so that its content is added to the search index.

在本文中,您将了解:

启动第 4 阶段

关于爬网

根据您的权限级别,您可以从以下两个位置开始爬网:

开始爬网的位置 所需权限级别
管理中心
搜索服务 应用程序管理员
在目录上
网站集管理员

可以从两个位置开始爬网的原因是,使用目录内容 (让我们称他们为内容管理员) 不太可能具有 搜索服务应用程序管理员 权限。 换句话说,他们无法访问 管理中心。

更改目录内容,有助于迅速爬网此内容,以使其显示在发布网站中。

幸运的是,内容管理员可以使新内容可用,而无需困扰搜索服务应用程序管理员运行新的爬网。 本文稍后将介绍如何执行此操作,但首先让我们看看如何在管理中心启动完全爬网。

如何启动中心管理中的完全爬网

在 管理中心 中启动完全爬网前,您必须指定应进行爬网的内容源。 当运行完全爬网时,将对该内容源中的所有内容进行爬网,即使此内容已添加到搜索索引也是如此。

这种情况下,我们将爬网"本地 SharePoint"网站内容源。

  1. Go to Central Administration>Manage service applications>Search Service Application>Content Sources.

  2. “管理内容源 ”页上,暂停 在本地 SharePoint 网站 内容源上,然后从菜单中选择“ 开始完全爬网”。

    选择启动完全爬网

爬网状态显示在"状态"列中。

  1. 刷新此页,直到"状态"列中的值显示为"空闲"。 这表示已完成爬网。

    爬网状态

  2. (可选)可以通过选择“ 爬网日志”来验证是否已将项目添加到搜索索引。 在我们的方案中,现在我们的搜索索引中含有 870 个项目,接近于"产品"列表中含有的产品数量。

    爬网日志

如何启用管理中心中的连续爬网

您仅可以手动启动完全爬网。 没有人愿意每次更改目录内容后都要手动启动爬网,因为此方法既不高效也不可行。 所以,为了避免此类开销,您可以启用包含该目录的内容源的 连续爬网

连续爬网将按设置的时间间隔自动启动。 上一次爬网后的所有目录更改由爬网程序进行选取,然后将这些更改添加到搜索索引。

若要启用连续爬网:

  1. Go to Central Administration>Manage service applications>Search Service Application>Content Sources.

  2. “管理内容源 ”页上,选择要为其启用连续爬网的内容源,在本例中,这是 本地 SharePoint 网站。

  3. 选择"启用连续爬网"选项。

    启用连续爬网

如何设置连续爬网时间间隔

连续爬网的默认时间间隔为 15 分钟。 您可以使用 PowerShell 设置较短的时间间隔。 以下代码示例设置的连续爬网时间间隔为 1 分钟。

$ssa = Get-SPEnterpriseSearchServiceApplication
$ssa.SetProperty("ContinuousCrawlInterval", 1)

因此,通过启用连续爬网,可以避免内容管理员的无奈,他们不必再等待 搜索服务 应用程序管理员来为其启动爬网。 但是,对于一些目录更改,例如,将托管属性启用为精简条件,连续爬网是不够的,您必须对目录内容完全重建索引。 但不必担心,内容管理员无需担心,因为他们可以通过一种方法来启动目录的完全重建索引。

如何启动重建目录索引

若要为重建索引标记目录,下面是您应执行的操作:

  1. 在我们的方案中的目录 (“产品目录网站集”) 的“产品”列表中,选择“列表”选项卡“>列表设置>”“高级设置”。

  2. “高级设置” 页上,选择“ 重新编制索引列表”。

    选择“重新编制索引列表”

如何查看爬网状态和目录计划

可以查看特定目录的爬网状态和计划。 为此:

  1. 在我们的方案中,在目录 (“产品目录网站集”) 的“ 产品 ”列表中,选择“ 列表 ”选项卡“ >列表设置>”“目录设置”。

  2. 在"目录设置"页面上,您可以查看目录上次爬网时间和计划时间运行的爬网类型。 在我们的方案中,您可以看到目录上次爬网时间为 2013 年 3 月 4 日上午 5:30:17,并安排每隔 15 分钟运行一次连续爬网。

    爬网时间状态

所以,内容管理员对此很兴奋,因为可以在较短的时间间隔内将他们的内容添加到搜索索引。同时,搜索服务 应用程序管理员也会对此表示欢迎,因为内容管理员不必再不断地烦扰他们启动爬网。

本系列的下一篇文章

从网站栏到托管属性 - 有何作用?

另请参阅

其他资源

为跨网站发布配置搜索