从电子数据展示 (Premium) 中的审阅集导出文档

提示

电子数据展示 (预览) 现已在新的 Microsoft Purview 门户中提供。 若要详细了解如何使用新的电子数据展示体验,请参阅 了解电子数据展示 (预览版)

导出允许用户在从电子数据展示 (Premium) 中的审阅集导出文档时自定义下载包中包含的内容。

要从审阅集中导出文档,请执行以下操作:

注意

在有限的时间内,新的 Microsoft Purview 门户中也提供了此经典电子数据展示体验。 在电子数据展示 (预览版中启用合规性门户经典电子数据展示体验) 体验设置,以便在新的 Microsoft Purview 门户中显示经典体验。

  1. 在Microsoft Purview 合规门户中,打开电子数据展示 (Premium) 事例,选择“审阅集”选项卡,然后选择要导出的审阅集。

  2. 在审阅集中,选择要导出的项目。

  3. 选择 “操作>导出”。

    导出工具显示浮出控件页,其中包含用于配置导出的设置。 某些选项默认处于选中状态,但你可以更改这些选项。 有关可配置的导出选项的说明,请参阅以下部分。

    用于从审阅集中导出项目的配置选项。

  4. 配置导出选项后,选择“ 导出 ”以启动导出过程。 根据在 “输出选项 ”部分选择的选项,可以通过直接下载或在组织的 Azure 存储帐户中访问导出文件。

注意

导出作业在案例的生存期内保留。 但是,必须在导出作业完成后的 30 天内从导出作业下载内容。

提示

如果你不是 E5 客户,请使用 90 天Microsoft Purview 解决方案试用版来探索其他 Purview 功能如何帮助组织管理数据安全性和合规性需求。 立即在 Microsoft Purview 试用中心开始。 了解有关 注册和试用条款的详细信息。

导出选项

使用以下选项配置导出。 某些输出选项并非允许所有选项,最值得注意的是,导出为 PST 格式时,不允许导出文本文件和编辑的 PDF。

  • 导出名称:导出作业的名称。 这用于命名将要下载的 ZIP 文件。

  • 说明:用于添加说明的自由文本字段。

  • 导出这些文档

    • 仅所选文档:此选项仅导出当前选定的文档。 仅当在审阅集中选择了项目时,此选项才可用。
    • 所有筛选的文档:此选项导出活动筛选器中的文档。 仅当筛选器应用于审阅集时,此选项才可用。
    • 审阅集中的所有文档:此选项导出审阅集中的所有文档。
  • 展开所选内容:使用以下选项导出与审阅集中筛选/所选项目相关的其他项目:

    • :此选项不会导出家庭项目或对话项目。 它仅将所选项目或导出到审阅集列表中的所有项目。
    • 包括关联的家庭项目:此选项包括关联的家庭项。 家庭项是共享同一 FamilyId 元数据属性值 的项。 例如,附加到电子邮件的文档与电子邮件共享相同的 FamilyId 。 如果选择此选项,则电子邮件和文档将在此示例中导出,即使文档可能未包含在审阅集项目列表中也是如此。
    • 包括关联的对话项目:此选项包括同一 Teams 或Viva Engage对话中的关联项目。 对话项是共享同一 ConversationId 元数据属性值 的项目。 对话的所有邮件、帖子和相应的脚本文件共享相同的 ConversationId

    如果选择了除 “无” 以外的任何选项,则会导出共享同一关联 ID 的所有项目,即使其中某些项目可能不在当前审阅集查询的结果中也是如此。 有关对话项的详细信息,请参阅 Microsoft Teams 中内容的电子数据展示 (Premium) 工作流

  • 输出选项:导出的内容可以直接通过 Web 浏览器下载,也可以发送到 Azure 存储帐户。 前两个选项支持直接下载。

    • 仅报告:仅创建摘要和加载文件。

    • 如果可能,松散文件和 PCT (电子邮件将添加到 PCT) :文件以类似于用户在本机应用程序中看到的原始目录结构的格式导出。 有关详细信息,请参阅 松散文件和 PST 导出结构 部分。

    • 精简目录结构:文件将导出并包含在下载中。

    • 导出到 Azure 存储帐户的精简目录结构:文件导出到组织的 Azure 存储帐户。 对于此选项,必须提供 Azure 存储帐户中容器的 URL 才能将文件导出到其中。 还必须为 Azure 存储帐户提供共享访问签名 (SAS) 令牌。 有关详细信息,请参阅 将审阅集中的文档导出到 Azure 存储帐户

      注意

      精简输出选项包括所有提取的项。 压缩输出的项目计数始终大于 松散文件和 PCT 选项,因为电子邮件和附件的计数方式不同。 例如,对于具有两个附件的电子邮件,压缩输出导致 3 个项目 (1 个项目的电子邮件和 1 个项目的每个附件) 而 松散文件和 PT 选项将导致电子邮件和所有附件的 1 项。

  • Include

    • 标记:选择后,标记信息包含在加载文件中。
    • 文本文件:此选项包括导出中本机文件的提取文本版本。
    • 将已编修的本机文件替换为转换的 PDF:如果在审阅期间生成了编修的 PDF 文件,则这些文件可用于导出。 可以通过不选择此选项来选择仅导出 (编辑的本机文件) 也可以选择此选项来导出包含实际修订的 PDF 文件。

以下部分介绍松散文件和精简目录结构选项的文件夹结构。 导出被分区到 ZIP 文件中,最大大小为 75 GB 的未压缩内容。 如果导出大小小于 75 GB,则导出由摘要文件和单个 ZIP 文件组成。 对于超过 75 GB 的未压缩数据的导出,将创建多个 ZIP 文件。 下载后,可以将 ZIP 文件解压缩到单个位置以重新创建完全导出。

松散文件和 PST 导出结构

如果选择此导出选项,则导出的内容将按以下结构进行组织:

  • Summary.csv:包括从审阅集导出的内容的摘要。 此文件使用以下列进行构造:

    • 总计:在审阅集中找到的项目数。
    • 实际:在包中提取的导出项数。
    • 错误:错误和警告数。 有关详细信息,请参阅错误和警告文件。 警告和错误文件包含有关未导出的项的重要信息。 检查此文件,确保了解哪些文件存在问题。
    • 跳过的处理:跳过处理的项目数。

    注意

    跳过的处理还包含 PST 格式的提取子项数。 例如,审阅集有两个项目,一个对应于电子邮件,一个对应于附件。 当文件转换为 PST 时,它仅映射到一个项目 (邮件项目) 。 这会导致跳过子附件。

    • 导出容器:它包含为导出创建的 .zip 和 .pst 文件的列表。
  • 根文件夹:此文件夹位于名为 [导出名称] x 的 z.zip 中,每个 .zip 文件分区重复。 根文件夹包含以下项:

    • z.csv的Export_load_file_x :元数据文件。
    • 警告和错误 x z.csv:此文件包含有关尝试从审阅集导出时遇到的错误的信息。
  • Exchange:此文件夹包含存储在 PST 文件中的 Exchange 的所有内容。 此选项不能包含修订的 PDF 文件。 如果在审阅集中选择了附件,则会导出父电子邮件并附加附件。

    Exchange 文件夹还可以包含名为 mailboxname_loosefiles.zip 的子文件夹,其中包含以下项:

    • 信息权限管理 (IRM) 已解码的受保护消息。
    • 修正错误的消息。
    • 邮件中引用的新式附件或链接。
    • (未包含在 Exchange 文件夹) 的 PST 文件中的加密项目。
  • SharePoint:此文件夹包含来自 SharePoint 的所有本机文件格式的本机内容。 此选项不能包含修订的 PDF 文件。

注意

审阅集中选择的 “组 ”选项确定从审阅集导出的内容中包括哪些项目。 如果选择“ ”,则导出的内容仅包括所选或筛选的项。 如果选择了 “按系列分组 ”,则导出的内容将包括系列中的所有项目。

精简目录结构

  • Summary.csv:包括从审阅集导出的内容的摘要。 此文件使用以下列进行构造:

    • 总计:在审阅集中找到的项目数。
    • 实际:在包中提取的导出项数。
    • 错误:错误和警告数。 有关详细信息,请参阅错误和警告文件。
    • 跳过的处理:跳过处理的项目数。

    注意

    跳过的处理还包含 PST 格式的提取子项数。 例如,审阅集有两个项目,一个对应于电子邮件,一个对应于附件。 当文件转换为 PST 时,它仅映射到一个项目 (邮件项目) 。 这会导致跳过子附件。

    • 导出容器:它包含为导出创建的 .zip 和 .pst 文件的列表。
  • 根文件夹:此文件夹位于名为 [Export Name] x 的 z.zip 中,将针对每个 ZIP 文件分区重复。

    • z.csv的Export_load_file_x :元数据文件,还包括 ZIP 文件中存储的每个文件的位置
    • 警告和错误 x z.csv:此文件包含有关尝试从审阅集导出时遇到的错误的信息。
    • NativeFiles:此文件夹包含导出的所有本机文件。 如果选择了“用 已转换的 PDF 替换已编修的本机 ”选项,则本机文件将替换为已编修的 PDF。
    • Error_files:此文件夹包含有提取错误或其他处理错误的文件。 这些文件放置在单独的文件夹中,包括 ExtractError 或 ProcessingError。 这些文件在加载文件中列出。
    • Extracted_text_files:此文件夹包含处理时生成的所有提取文本文件。

导出到 Azure 存储帐户的精简目录结构

此选项使用与 压缩目录结构相同的常规结构,压缩内容并将数据保存到 Azure 存储帐户。 使用第三方电子数据展示提供程序时使用此选项。 有关如何使用此选项的详细信息,请参阅 将审阅集中的文档导出到 Azure 存储帐户