导出搜索结果和搜索报告
组织成功运行内容搜索后,可以将搜索结果导出到本地计算机。 导出电子邮件结果时,将以 PST 文件形式下载到计算机。 当你从 SharePoint 和 OneDrive 网站导出内容时,将导出本地 Office 文档副本。 导出的搜索结果中还包含其他文档和报告。
导出内容搜索结果
导出内容搜索结果涉及准备结果以及将结果下载到本地计算机。 导出搜索结果的这些步骤也适用于导出与 Microsoft Purview 电子数据展示 (Standard) 事例关联的搜索结果。
导出搜索结果的先决条件
若要使用户导出搜索结果,必须在 Microsoft Purview 合规性门户中为其分配“ 导出管理 ”角色。 此角色分配给内置电子数据展示管理员角色组。 它没有默认分配至组织管理角色组。 有关详细信息,请参阅分配电子数据展示权限。
用于导出搜索结果的计算机必须满足以下系统要求:
- 最新版本的 Windows(32 位或 64 位)
- Microsoft .NET Framework 4.7 或更高版本
Microsoft Edge必须用于运行电子数据展示导出工具。 不再支持使用 Internet Explorer 11 导出搜索结果。
警告
由于最近更改了Microsoft Edge,默认情况下不再启用 ClickOnce 支持。 有关在 Microsoft Edge 中启用 ClickOnce 支持的说明, 请参阅在 Microsoft Edge中使用电子数据展示导出工具。 Microsoft 不开发面向 ClickOnce 应用程序的第三方扩展或加载项。 不支持使用具有第三方扩展或加载项的浏览器导出数据。
当组织导出搜索结果时,数据将暂时存储在 Microsoft 提供的 microsoft 云中Azure 存储位置,然后再将其下载到本地计算机。 贵组织可连接至 Azure 中的终结点 *.blob.core.windows.net(通配符代表导出工作的唯一标识符)。 搜索结果数据在创建两周后从Azure 存储位置删除。
如果组织使用代理服务器与 Internet 通信,则必须在用于导出搜索结果的计算机上定义代理服务器设置(以便代理服务器可以对导出工具进行身份验证)。 若要完成此步骤,请在与计算机的 Windows 版本匹配的位置打开 machine.config 文件。
32 位。 %windir%\Microsoft.NET\Framework\[version]\Config\machine.config
64 位。 %windir%\Microsoft.NET\Framework64\[version]\Config\machine.config
将以下行添加到 configuration 和< / >configuration 标记之间的某个位置的<>machine.config 文件。 请务必将 ProxyServer 和 Port 替换为组织的正确值。 例如,proxy01.contoso.com:80。
<system.net> <defaultProxy enabled="true" useDefaultCredentials="true"> <proxy proxyaddress="https://ProxyServer :Port " usesystemdefault="False" bypassonlocal="True" autoDetect="False" /> </defaultProxy> </system.net>
其他导出注意事项
组织还应在计划导出搜索结果时考虑以下各项:
- 步骤 2 中用于下载搜索结果的电子数据展示导出工具不支持使用脚本或运行 PowerShell cmdlet 实现自动化。 强烈建议组织不要在步骤 1 或步骤 2 中的下载过程中自动执行准备过程。 如果组织自动执行上述任一流程,Microsoft 支持在遇到问题时将不提供帮助。
- 建议组织将搜索结果下载到本地计算机。 若要避免公司的防火墙或代理基础结构在下载搜索结果时导致问题,组织应考虑将搜索结果下载到其网络外部的虚拟桌面。 导出大量文件时,此过程还可以减少 Azure 数据连接中出现的超时。 有关虚拟桌面的详细信息,请参阅 Windows 虚拟桌面。
- 若要提高下载搜索结果时的性能,请考虑将返回大量结果的搜索划分为较小的搜索。 例如,可以在搜索查询中使用日期范围来返回可更快下载的较小结果集。
- 如果搜索结果早于七天,并且你提交导出作业,则会显示一条错误消息,提示你重新运行搜索以更新搜索结果。 如果发生这种情况,请取消导出,重新运行搜索,然后重新启动导出。
第 1 步:准备要导出的搜索结果
第一步是要准备用于导出的搜索结果。 准备结果时,这些结果将上传到 Microsoft 提供的 microsoft 云中Azure 存储位置。 邮箱和网站中的内容以每小时 2 GB 的最大速率上传。
在 Microsoft Purview 合规性 门户中,在导航窗格中选择 电子数据展示 。
在 “内容搜索 ”页上,选择要从中导出结果的内容搜索。
在浮出控件页底部的 操作 菜单上,选择 导出结果。 随即显示“导出结果”浮出控件页。 可用于导出内容的导出选项取决于搜索结果是位于邮箱还是网站中,还是同时位于两者的组合中。
在“输出”选项下,选择以下选项之一:
- 除部分索引外的所有项(无法识别的格式、已加密或由于其他原因未编制索引)。 此选项仅导出索引项。
- 包括格式无法识别、已加密或因其他原因未编入索引的所有项目。 此选项导出索引项和未编制索引的项目。
- 仅包括格式无法识别、已加密或因其他原因未编入索引的项目。 此选项仅导出未编制索引的项目。
在“将 Exchange 内容导出为”下,选择以下选项之一:
- 每个邮箱一个 PST 文件。 为每个包含搜索结果的用户邮箱导出一个 PST 文件。 来自用户存档邮箱的任何结果都包含在同一 PST 文件中。 此选项从源邮箱重现邮箱文件夹结构。
- 一个包含所有邮件的 PST 文件。 导出单个 PST 文件(名为 Exchange.pst),其中包含搜索中包含的所有源邮箱的搜索结果。 此选项将重现每个邮件的邮箱文件夹结构。
- 一个包含单个文件夹中所有邮件的 PST 文件。 将搜索结果导出到单个 PST 文件,其中所有邮件都位于单个顶级文件夹中。 此选项还允许数据主体按时间顺序查看项目(按发送日期排序项目),而无需导航到每个项目的原始邮箱文件夹结构。
- 单个邮件。 使用 .msg 格式将搜索结果导出为单个电子邮件。 如果选择此选项,电子邮件搜索结果将导出到文件系统中的文件夹。 单个邮件的文件夹路径与将结果导出到 PST 文件时所用的文件夹路径相同。
配置剩余选项:
- 为 Exchange 内容启用重复数据删除。 选中此复选框可排除重复的消息。 因此,如果在已搜索的邮箱中找到同一封邮件的多个副本,则此选项意味着将只导出邮件的一个副本。 导出结果报表(名为 Results.csv 的文件)将为重复邮件的每个副本包含一行,以便您可以标识包含重复邮件副本的邮箱(或公用文件夹)。 有关重复数据删除以及如何识别重复项的详细信息,请参阅 电子数据展示搜索结果中的重复数据删除。
- 包括 SharePoint 文件的版本。 选中此复选框可导出所有版本的 SharePoint 文档。 仅当搜索的内容源包括 SharePoint 或OneDrive for Business网站时,才会显示此选项。
- 以压缩文件夹形式 (zip 格式) 导出文件。 仅包括用于将搜索结果导出到压缩文件夹的单个邮件和 SharePoint 文档复选框。 仅当您选择将 Exchange 项目导出为单个邮件以及搜索结果包括 SharePoint 或 OneDrive 文档时,才会显示此选项。 导出项时,此选项主要用于解决 Windows 文件路径名称中 260 个字符的限制。
选择 “导出 ”以启动导出过程。 导出过程从原始内容位置收集搜索结果。 然后,它将它们上传到 Microsoft 云中的Azure 存储位置。 完成该一次性过程可能需要几分钟。
有关下载导出的搜索结果的说明,请参阅下一部分。
第 2 步:下载搜索结果
下一步是将搜索结果从 WindowsAzure 存储区域下载至你的本地计算机。
在 Microsoft Purview 合规性 门户中,在导航窗格中选择 电子数据展示 。
在“内容搜索”页上,选择“导出 ”选项卡。
可能需要选择 刷新 才能更新导出作业列表,以便它显示你创建的导出作业。 导出作业的名称与相应的搜索名称相同, _Export 追加到搜索名称中。
选择在步骤 1- 准备要导出的搜索结果中创建的导出作业。
在浮出控件页面上,选择“导出密钥”下的“复制到剪贴板”。 此密钥将在步骤 6 中用于下载搜索结果。
警告
任何人都可以安装和启动电子数据展示导出工具,然后使用此密钥下载搜索结果。 因此,组织应采取预防措施来保护此密钥,就像保护密码或其他安全相关信息一样。
在浮出控件页面顶部,选择“下载结果”。
如果系统提示你安装 电子数据展示导出工具,请单击“安装”。
在 电子数据展示导出工具中,完成以下步骤:
- 将步骤 3 中复制的导出密钥粘贴到相应的框中。
- 选择“浏览”指定要下载搜索结果文件的位置。
警告
由于下载期间网络活动较高,应仅将搜索结果下载到本地计算机上内部驱动器上的某个位置。 为获得最佳下载体验,请遵循以下准则:
- 请勿将搜索结果下载到 UNC 路径、映射的网络驱动器、外部 USB 驱动器或同步的OneDrive for Business帐户。
- 对将搜索结果下载到的文件夹禁用防病毒扫描。
- 将搜索结果下载到用于并发下载作业的不同文件夹。
选择“开始”将搜索结果下载到计算机。
电子数据展示工具显示有关导出过程的状态信息,包括要下载的剩余项的估计数量(和大小)。 导出过程完成后,你可以在文件下载的位置访问它们。
导出报告
导出搜索结果时,除搜索结果外,以下文档也包括在内:
-
导出摘要。 一个包含导出摘要的 Excel 文档。 此电子表格包含以下信息:
- 已搜索的内容源数。
- 搜索结果的估计和下载大小。
- 已导出的估计和下载的项数。
- Manifest。 清单文件(XML 格式)包含搜索结果中的每个项的信息。
-
结果。 Excel 文档,包含下载的每个搜索结果项的信息。 对于电子邮件,结果日志包含有关每个邮件的信息,包括:
邮件在源邮箱中的位置(包括邮件位于主邮箱还是存档邮箱)。
发送或接收邮件的日期。
邮件的主题行。
邮件的发件人和收件人。
如果在导出搜索结果时启用了重复删除选项,则邮件是否为重复消息。 重复消息在“复制到项”列中有一个值,该值将消息标识为重复消息。 “复制到项”列中的值包含已导出的消息的项标识。 有关详细信息,请参阅 电子数据展示搜索结果中的重复数据删除。
对于来自 SharePoint 和 skydrive_pro 网站的文档,结果日志中包含每个文档的信息,包括:
- 文档的 URL。
- 文档所在的网站集的 URL 。
- 上次修改文档的日期。
- 文档的名称(位于结果日志中的主题列)。
- 未编制索引的项。 一个 Excel 文档,其中包含有关搜索结果中将包含的任何部分索引项的信息。 如果在生成搜索结果报表时不包括部分索引项,则仍将下载此报表。 但是,它将为空。
- 错误和警告。 包含导出过程中遇到的文件的错误和警告。 有关每个单独的错误或警告的特定信息,请参阅“错误详细信息 ”列。
- 跳过的项目。 当组织从 SharePoint 和OneDrive for Business网站导出搜索结果时,导出通常会包括跳过的项目报表 (SkippedItems.csv)。 此报表中引用的项目通常是不会下载的项目,例如文件夹或文档集。 根据设计,不导出这些类型的项。 对于已跳过的其他项目, 跳过的项目报告中的“错误类型 ”和 “错误详细信息 ”字段显示跳过该项目的原因,并且未与其他搜索结果一起下载。
- Trace.log。 包含有关导出过程的详细日志记录信息。 它可以帮助在导出过程中发现问题。 如果打开票证时Microsoft 支持与导出搜索结果相关的问题,系统可能会要求你提供此跟踪日志。
注意
组织可以导出这些文档,而无需导出实际的搜索结果。 请查阅导出内容搜索报告。
导出内容搜索报告
前面的部分检查了组织如何从 Microsoft Purview 合规性门户中的内容搜索(或与 Microsoft Purview 电子数据展示(标准)案例关联的搜索中导出完整的搜索结果集。 或者,组织可以导出导出实际搜索结果时生成的相同报表。
当组织导出报表时,报表文件将下载到本地计算机上与内容搜索同名但追加了 *_*ReportsOnly的文件夹。 例如,如果内容搜索名为 ContosoCase0815,则将报表下载到名为 ContosoCase0815_ReportsOnly的文件夹。 有关报表中包含的文档列表,请参阅 报表中包含的内容。
导出搜索结果的先决条件
若要导出搜索报告,必须在合规性门户中分配 合规性搜索管理 角色。 默认情况下,此角色分配给内置 电子数据展示管理器 和 组织管理 角色组。 有关详细信息,请参阅分配电子数据展示权限。
用于导出搜索结果的计算机必须满足以下系统要求:
- 最新版本的 Windows(32 位或 64 位)
- Microsoft .NET Framework 4.7 或更高版本
Microsoft Edge必须用于运行电子数据展示导出工具。 不再支持使用 Internet Explorer 11 导出搜索结果。
注意
由于最近更改了Microsoft Edge,默认情况下不再启用 ClickOnce 支持。 有关在 Microsoft Edge 中启用 ClickOnce 支持的说明, 请参阅在 Microsoft Edge中使用电子数据展示导出工具。 Microsoft 不开发面向 ClickOnce 应用程序的第三方扩展或加载项。 不支持使用具有第三方扩展或加载项的浏览器导出数据。
如果搜索返回的结果的估计总大小超过 2 TB,则导出报表将失败。 若要成功导出报表,请尝试缩小范围。 这样,重新运行搜索时,结果的估计大小将小于 2 TB。
如果搜索结果早于七天,并且你提交导出报告作业,则会显示一条错误消息,提示你重新运行搜索以更新搜索结果。 如果发生这种情况,请取消导出,重新运行搜索,然后重新启动导出。
导出搜索报告对同时运行的最大导出数进行计数。 它还根据单个用户可以运行的最大导出数进行计数。 有关导出限制的详细信息,请参阅 导出内容搜索结果。
步骤 1:生成要导出的报表
第一步是准备要下载到计算机的报表。 导出报表时,报表文档将上传到 Microsoft 云中的Azure 存储区域。 此过程中的步骤与前面标题为 “准备要导出的搜索结果”部分中的步骤相当相似。 因此,不会显示屏幕截图以简化指令。
在 Microsoft Purview 合规性 门户中,在导航窗格中选择 电子数据展示 。
在 “内容搜索 ”页上,选择要从中导出结果的内容搜索。
在浮出控件页底部的 操作 菜单上,选择 导出结果。 随即显示“导出报表浮出控件”页。 可用于导出内容的导出选项取决于搜索结果是位于邮箱还是网站中,还是同时位于两者的组合中。
随即显示“导出报表浮出控件”页。 可用于导出有关搜索信息的导出报表选项取决于搜索结果是位于邮箱还是网站中,还是同时位于两者的组合中。
在“输出选项”下,选择以下选项之一:
- 除部分索引外的所有项(无法识别的格式、已加密或由于其他原因未编制索引)。 此选项仅导出有关索引项的信息。
- 包括格式无法识别、已加密或因其他原因未编入索引的所有项目。 此选项导出有关索引项和未编制索引项的信息。
- 仅包括格式无法识别、已加密或因其他原因未编入索引的项目。 此选项仅导出有关未编制索引项的信息。
配置“ 为 Exchange 内容 启用重复数据删除”选项。
如果选择此选项,则导出摘要报表中包含重复消息的计数(重复删除之前和重复后)。 此外,manifest.xml 文件中将只包含一个消息副本。 但导出结果报表将为重复消息的每个副本包含一行。 通过执行此操作,可以标识包含重复邮件副本的邮箱。 有关导出的报表的详细信息,请参阅 报表中包含的内容。
如果未选择此选项,导出报表将包含有关搜索返回的所有消息(包括重复项)的信息。
有关重复数据删除以及如何识别重复项的详细信息,请参阅 电子数据展示搜索结果中的重复数据删除。
选择生成报表。
搜索结果已可供下载。 因此,报表文档将上传到 Microsoft 云中的Azure 存储位置。 此进程可能需要几分钟。
有关下载导出的搜索报告的说明,请参阅下一部分。
步骤 2:下载报告
下一步是将报告从 Azure 存储区域下载至你的本地计算机。
重要
导出的搜索报告必须在步骤 1 中生成后的 14 天内下载。
在 Microsoft Purview 合规性 门户中,在导航窗格中选择 电子数据展示 。
在“内容搜索”页上,选择“导出 ”选项卡。
注意
可能需要选择 刷新 才能更新导出作业列表,以便它显示你创建的导出作业。 导出作业的名称与相应的搜索名称相同,_Export 追加到搜索名称中。
选择在步骤 1 中创建的导出作业。
在“导出报表浮出控件”页面上,选择“导出密钥”下的“复制到剪贴板”。 在步骤 6 中,将使用此密钥下载搜索结果。
重要
任何人都可以安装和启动电子数据展示导出工具,然后使用此密钥下载搜索报告。 一定要采取预防措施来保护这些文件,就像保护密码或其他与安全相关的信息一样。
在浮出控件页面顶部,选择“下载结果”。
如果系统提示安装电子数据展示导出工具,请单击“安装”。
在 电子数据展示导出工具中,完成以下步骤:
- 将步骤 3 中复制的导出密钥粘贴到相应的框中。
- 选择“浏览”指定要下载搜索结果文件的位置。
选择“开始”将搜索结果下载到计算机。
电子数据展示工具显示有关导出过程的状态信息,包括要下载的剩余项的估计数量(和大小)。 导出过程完成后,你可以在文件下载的位置访问它们。
知识检查
为以下每个问题选择最佳答案。