在 SharePoint Server 中的搜索索引中添加或删除文件类型

适用于:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint in Microsoft 365

在开始之前,你可能想要读取 SharePoint Server 中默认的已爬网文件扩展名和分析的文件类型。 本文列出了默认情况下 SharePoint Server 包含在搜索索引中的文件类型。

如果你的 SharePoint 环境是混合的并且使用 云混合搜索,则可以决定 SharePoint Server 中存储的、要从 Microsoft 365 索引中添加或删除的文件类型。 在云搜索服务应用程序中托管爬网组件的服务器上使用以下过程。

从搜索索引添加或删除文件类型:

  1. 在“管理文件类型”页上从文件扩展名列表添加或删除文件扩展名。 请参阅从“管理文件类型”页添加或删除文件扩展名

  2. 对此更改可能会影响的所有内容源运行完全爬网。

完全爬网结束后,搜索索引将包括或排除您添加或删除的类型的文件中的属性。

在搜索索引中启动包括文件类型中的内容:

  1. 在承载 Search Service 应用程序中的内容处理组件的服务器上,检查文件类型的格式是否受内置格式处理程序或基于筛选器的第三方格式处理程序 (iFilter) 支持。 内置格式处理程序是 SharePoint Server 默认具有的格式处理程序。 请参阅查看关于可以解析的文件格式的信息

  2. 如果服务器没有文件类型的格式处理程序,请在搜索服务应用程序中托管内容处理组件的所有服务器上安装基于筛选器的第三方格式处理程序。 遵循第三方格式处理程序制造商提供的安装指南。

  3. 在承载 Search Service 应用程序中的内容处理组件的所有服务器上,启用对文件格式和文件扩展名的解析。 请参阅启用或禁用文件格式解析

  4. 对此更改可能会影响的所有内容源运行完全爬网。

完全爬网结束后,搜索索引将包括您启用的类型的文件中的内容。

在搜索索引中停止包括文件类型中的内容:

  1. 在承载 Search Service 应用程序中的内容处理组件的服务器上,检查文件类型的格式是否受内置格式处理程序或基于筛选器的第三方格式处理程序 (iFilter) 支持。 内置格式处理程序是 SharePoint Server 默认具有的格式处理程序。

  2. 在承载 Search Service 应用程序中的内容处理组件的所有服务器上,禁用对文件格式和文件扩展名的解析。 请参阅启用或禁用文件格式解析

  3. 对此更改可能会影响的所有内容源运行完全爬网。

完全爬网结束后,搜索索引将排除您禁用的类型的文件中的内容。

从“管理文件类型”页添加或删除文件扩展名

将文件扩展名添加到“管理文件类型”页

  1. 确认执行此过程的用户帐户是 Search Service 应用程序的管理员。

  2. 在管理中心的“应用程序管理”部分中,单击“ 管理服务应用程序”。

  3. 在“管理服务应用程序”页上的服务应用程序列表中,单击“Search Service 应用程序”。

  4. 在“搜索管理”页上的“爬网”部分,单击“文件类型”。 即会显示“管理文件类型”页。

  5. 单击“新建文件类型”

  6. 在“文件扩展名”框中,键入要添加的文件类型的扩展名。

  7. 单击“确定”

  8. 验证:确保扩展名显示在“管理文件类型”页上的文件类型列表中。

从“管理文件类型”页中删除文件扩展名

  1. 确认执行此过程的用户帐户是 Search Service 应用程序的管理员。

  2. 在管理中心的“应用程序管理”部分中,单击“ 管理服务应用程序”。

  3. 在“管理服务应用程序”页上的服务应用程序列表中,单击“Search Service 应用程序”。

  4. 在“搜索管理”页上的“爬网”部分,单击“文件类型”。 即会显示“管理文件类型”页。

  5. 指向要删除的文件类型,单击显示的箭头,然后单击“删除”

  6. 单击“确定”以确认要删除此文件类型。

  7. 验证:确保扩展名不再显示在“管理文件类型”页上的文件类型列表中。

查看关于可以解析的文件格式的信息

要查看关于内容处理组件具有其格式处理程序的文件格式的信息,您必须使用 Windows PowerShell。

  1. 确认执行此过程的用户帐户是 Search Service 应用程序的管理员。

  2. 在服务器上启动 SharePoint 命令行管理程序。

  3. 在 Microsoft PowerShell 命令提示符处,键入以下命令:

    $ssa = Get-SPEnterpriseSearchServiceApplication
    Get-SPEnterpriseSearchFileFormat -SearchApplication $ssa
    
    

    结果是由 $ssa 引用的搜索服务应用程序中的内容处理组件可以分析的所有文件格式的列表。 对于每个文件格式,列表将列出以下信息:

    • 文件扩展名和 mime 类型

    • 内容处理组件用来解析该格式的格式处理程序的类型。 “BuiltIn:True”条目表示内置格式处理程序。 条目“BuiltIn:False”指示基于第三方筛选器的格式处理程序。

    • 格式的解析状态。 “Enabled:True”条目表示已启用分析。 “Enabled:False”条目表示已禁用分析。

启用或禁用文件格式解析

要启用或禁用文件格式解析,您必须使用 Windows PowerShell。

启用使用内置格式处理程序解析文件格式

  1. 确认执行此过程的用户帐户是 Search Service 应用程序的管理员。

  2. 在托管内容处理组件的服务器上启动 SharePoint 命令行管理程序。

  3. 在 Microsoft PowerShell 命令提示符处,键入以下命令:

    $ssa = Get-SPEnterpriseSearchServiceApplication
    Set-SPEnterpriseSearchFileFormatState -SearchApplication $ssa FormatID $TRUE
    

    其中:

    • FormatID 是文件格式的标识。

    • $TRUE 启用格式处理程序以解析文件类型。

  4. 重新启动 SharePoint 搜索主机控制器服务以应用更改:

  • 在承载内容处理组件的服务器上打开一个命令提示符窗口。 在“开始”菜单上,依次单击“所有程序”和“附件”,右键单击“命令提示符”,然后单击“以管理员身份运行”

  • 若要停止 SharePoint 搜索主机控制器,请键入以下命令: net stop spsearchhostcontroller

  • 若要重新启动 SharePoint 搜索主机控制器,请键入以下命令: net start spsearchhostcontroller

  1. 验证:显示内容处理组件可以解析的扩展名和文件格式的列表,确保该文件扩展名在该列表中。 请参阅查看关于可以解析的文件格式的信息

禁用使用内置格式处理程序解析文件格式

  1. 确认执行此过程的用户帐户是 Search Service 应用程序的管理员。

  2. 在托管内容处理组件的服务器上启动 SharePoint 命令行管理程序。

  3. 在 Microsoft PowerShell 命令提示符处,键入以下命令:

    $ssa = Get-SPEnterpriseSearchServiceApplication
    Set-SPEnterpriseSearchFileFormatState -SearchApplication $ssa FormatID $FALSE
    

    其中:

    • FormatID 是文件格式的标识。

    • $FALSE 禁用格式处理程序解析文件类型。

  4. 重新启动 SharePoint 搜索主机控制器服务以应用更改:

    • 在承载内容处理组件的服务器上打开一个命令提示符窗口。 在“开始”菜单上,依次单击“所有程序”和“附件”,右键单击“命令提示符”,然后单击“以管理员身份运行”

    • 若要停止 SharePoint 搜索主机控制器,请键入以下命令: net stop spsearchhostcontroller

    • 若要重新启动 SharePoint 搜索主机控制器,请键入以下命令: net start spsearchhostcontroller

  5. 验证:显示内容处理组件可以解析的扩展名和文件格式的列表,确保该文件扩展名不在该列表中。 请参阅查看关于可以解析的文件格式的信息

启用使用基于筛选器的第三方格式处理程序解析文件格式

  1. 确认执行此过程的用户帐户是 Search Service 应用程序的管理员。

  2. 在托管内容处理组件的服务器上启动 SharePoint 命令行管理程序。

  3. 在 Microsoft PowerShell 命令提示符处,键入以下命令:

    $ssa = Get-SPEnterpriseSearchServiceApplication
    New-SPEnterpriseSearchFileFormat -SearchApplication $ssa FileNameExtension FileFormat application/FileApplication
    

    其中:

    • FileNameExtension 是该文件类型的文件扩展名。

    • FileFormat 是该文件类型的格式。 格式通常是应用程序的名称。

    • application/FileApplication 是该文件类型的 mime 类型。 mime 类型必须包含类型和子类型。 在此示例中,application 是类型,FileApplication 是子类型。 例如,对于 Word 文件,类型为 application,子类型为 msword。 它们一起构成了完整的 mime 类型:application/msword。

  4. 重新启动 SharePoint 搜索主机控制器服务以应用更改:

    • 在承载内容处理组件的服务器上打开一个命令提示符窗口。 在“开始”菜单上,依次单击“所有程序”和“附件”,右键单击“命令提示符”,然后单击“以管理员身份运行”

    • 若要停止 SharePoint 搜索主机控制器,请键入以下命令: net stop spsearchhostcontroller

    • 若要重新启动 SharePoint 搜索主机控制器,请键入以下命令: net start spsearchhostcontroller

  5. 验证:显示内容处理组件可以解析的扩展名和文件格式的列表,确保该文件扩展名在该列表中。 请参阅查看关于可以解析的文件格式的信息

禁用使用基于筛选器的第三方格式处理程序解析文件格式

  1. 确认执行此过程的用户帐户是 Search Service 应用程序的管理员。

  2. 在托管内容处理组件的服务器上启动 SharePoint 命令行管理程序。

  3. 在 Microsoft PowerShell 命令提示符处,键入以下命令:

    $ssa = Get-SPEnterpriseSearchServiceApplication
    Remove-SPEnterpriseSearchFileFormat -SearchApplication $ssa -Identity FileNameExtension
    

    其中:

    • FileNameExtension 是该文件类型的文件扩展名。
  4. 重新启动 SharePoint 搜索主机控制器服务以应用更改:

    • 在承载内容处理组件的服务器上打开一个命令提示符窗口。 在“开始”菜单上,依次单击“所有程序”和“附件”,右键单击“命令提示符”,然后单击“以管理员身份运行”

    • 若要停止 SharePoint 搜索主机控制器,请键入以下命令: net stop spsearchhostcontroller

    • 若要重新启动 SharePoint 搜索主机控制器,请键入以下命令: net start spsearchhostcontroller

  5. 验证:显示内容处理组件可以解析的扩展名和文件格式的列表,确保该文件扩展名不在该列表中。 请参阅查看关于可以解析的文件格式的信息