电子数据展示(高级)中的文档元数据字段

提示

电子数据展示 (预览) 现已在新的 Microsoft Purview 门户中提供。 若要详细了解如何使用新的电子数据展示体验,请参阅 了解电子数据展示 (预览版)

下表列出了在 Microsoft Purview 电子数据展示 (Premium) 中,审阅集中文档的元数据字段。 有关在收集电子数据展示 (Premium) 事例的数据时搜索Microsoft 365 内容位置时可搜索属性的详细信息,请参阅 内容搜索的关键字查询和搜索条件

此表提供以下信息:

  • 字段名称和显示字段名称:在审阅集中查看所选文档的文件元数据时,元数据字段的名称和显示字段的名称。 查看文档的文件元数据时,不包含某些元数据字段。 这些字段以星号 (*) 突出显示。
  • 可搜索字段名称: 运行 审阅集查询时可以搜索的属性的名称。
  • 导出的字段名称: 导出文档时包含的元数据字段的名称。
  • 描述: 元数据字段的说明。

注意

审阅集搜索中的“关键字”字段使用关键字查询语言 (KQL) 。 “ 可搜索字段名称 ”列中列出的字段可以在审阅集搜索的 “关键字” 字段中使用,以形成复杂查询,而无需使用查询生成器。 有关 KQL 的详细信息,请参阅 关键字查询语言语法参考

字段名称和显示字段名称 可搜索字段名称 导出的字段名称 说明
附件内容 ID AttachmentContentId 未导出 项目的附件内容 ID。
律师客户特权分数 AttorneyClientPrivilegeScore 未导出 律师-客户端特权模型内容分数。
作者 作者 Doc_authors 从文档元数据创作。
BCC Bcc Email_bcc 消息类型的密件抄送字段。 格式为 DisplayName <SMTPAddress>
CC Cc Email_cc 邮件类型的抄送字段。 格式为 DisplayName <SMTPAddress>
通道名称 频道 ChannelName 此字段是 Teams 频道名称。 仅适用于Microsoft Teams 内容。
合规性标签 ComplianceLabels Compliance_labels 应用于 Office 365 中内容的保留标签
复合路径 CompoundPath Compound_path 描述项源的人类可读路径。
内容* 内容 未导出 提取项的文本。
对话正文 ConversationBody 未导出 项的对话正文。
对话 ID ConversationId Conversation_ID 消息中的对话 ID。 对于 Teams 1:1 和群组聊天,同一对话中的所有脚本文件及其家庭项目共享相同的对话 ID。 有关详细信息,请参阅 Microsoft Teams 中内容的电子数据展示 (Premium) 工作流
对话家庭 ID ConversationFamilyID ConversationFamilyID 标识会话的各个元素和会话中的相关项的 ID。
对话索引 不可搜索 Conversation_index 邮件中的对话索引。
对话名称 不可搜索 ConversationName 此字段取决于内容类型。
Teams 1:1 聊天: 第一条消息的前 40 个字符。
Teams 1:N 聊天: 群组聊天的名称;如果不可用,则为第一条消息的前 40 个字符。
Teams 频道帖子: 帖子标题或公告副标题;如果不可用,则为第一条消息的前 40 个字符。
对话 Pdf 时间 ConversationPdfTime 未导出 创建对话的 PDF 版本的日期。
对话修订刻录时间 ConversationRedactionBurnTime 未导出 为聊天创建对话的 PDF 版本的日期。
对话主题 ConversationTopic 未导出 项的对话主题。
对话类型 ConversationType ConversationType 聊天对话的类型。 值为:
Teams 1:1 和群组聊天以及所有 Viva Engage 对话:
Teams 频道和专用频道: 渠道
包含已删除的消息 ContainsDeletedMessage ContainsDeletedMessage 指示聊天脚本是否包含已删除的消息
包含已编辑的消息 ContainsEditedMessage ContainsEditedMessage 指示聊天脚本是否包含已编辑的消息
Teams 公告标题 TeamsAnnouncementTitle TeamsAnnouncementTitle 团队公告的标题。
N/A N/A Converted_file_path 转换后的导出文件的路径。 仅供内部Microsoft使用。
Custodian Custodian Custodian 与项目关联的保管人的名称。
日期 日期 日期 日期是依赖于文件类型的计算字段。

电子邮件:发送日期
电子邮件附件:上次修改文档的日期;如果不可用,则为父级的发送日期
嵌入文档:上次修改文档的日期;如果不可用,则为父级的上次修改日期
SPO 文档 (包括新式附件) :文档的上次修改日期;如果不可用,则为 SharePoint 上次修改日期
非 Office 365 文档:上次修改日期
会议:会议开始日期
VoiceMail:发送日期
IM:发送日期
Teams:发送日期

文档注释 DocComments Doc_comments 来自文档元数据的注释。
文档公司 不可搜索 Doc_company 文档元数据中的公司。
文档创建日期 CreatedTime Doc_date_created 从文档元数据创建日期。
DocIndex* 不可搜索 未导出 系列中的索引。 -10 表示它是根。
文档关键字 不可搜索 Doc_keywords 文档元数据中的关键字。
文档修改者 不可搜索 Doc_modified_by 上次从文档元数据修改文档的用户。
文档修订 Doc_Version Doc_Version 从文档元数据进行修订。
文档主题 不可搜索 Doc_subject 文档元数据中的主题。
文档模板 不可搜索 Doc_template 文档元数据中的模板。
DocLastSavedBy 不可搜索 Doc_last_saved_by 上次保存文档的用户的名称。
主导主题 DominantTheme Dominant_theme 为分析计算的主导主题。
重复子集 不可搜索 Duplicate_subset 确切重复项的组 ID。
EmailAction* 不可搜索 Email_action 值为 NoneReplyForward;基于邮件的主题行。
请求的电子邮件送达回执 不可搜索 Email_delivery_receipt 用于送达回执的 Internet 标头中提供的电子邮件地址。
重要性 EmailImportance Email_importance 消息的重要性: 0 - 低; 1 - 正常; 2 - 高
忽略处理错误 ErrorIgnored Error_Ignored 错误被忽略且未修正。
EmailInternetHeaders EmailInternetHeaders Email_internet_headers 电子邮件中完整的电子邮件标头集
EmailLevel* 不可搜索 Email_level 指示邮件所属的电子邮件线程中的级别;附件继承其父邮件的值。
电子邮件 ID 不可搜索 Email_message_ID 消息中的 Internet 消息 ID。
EmailReadReceiptRequested 不可搜索 Email_read_receipt Internet 标头中提供的电子邮件地址,用于阅读回执。
电子邮件安全性 EmailSecurity Email_security 消息的安全设置: 0 - 无; 1 - 已签名; 2 - 加密; 3 - 加密和签名。
电子邮件敏感度 EmailSensitivity email_sensitivity 消息的敏感度设置: 0 - 无; 1 个人; 2 - 专用; 3 - CompanyConfidential。
电子邮件集 EmailSet Email_set 同一电子邮件集中所有邮件的组 ID。
EmailThread* 不可搜索 Email_thread 邮件在电子邮件集中的位置;由从根消息到当前消息的节点 ID 组成,由句点 (.) 分隔。
N/A N/A Export_native_path 导出文件的路径。
提取的内容类型 不可搜索 Native_type 提取的内容类型,以 mime 类型的形式;例如 ,image/jpeg
N/A N/A Extracted_text_path 导出中提取的文本文件的路径。
ExtractedTextLength* 不可搜索 Extracted_text_length 提取的文本中的字符数。
FamilyDuplicateSet* 不可搜索 Family_duplicate_set (相同内容和所有相同附件) 完全重复的系列的数字标识符。
家庭 ID FamilyId Family_ID 将附件和从电子邮件中提取的项目分组在一起,并与其父项聊天。 这包括聊天或电子邮件以及所有附件和提取的项目。
家庭大小 不可搜索 Family_size 系列中的文档数。
文件类 FileClass File_class 对于 SharePoint 和 OneDrive 中的内容: 文档
对于来自 Exchange 的内容: 电子邮件附件
对于 Teams 或 Viva Engage: 对话中的内容。
文件 ID FileId File_ID 文档标识符在事例中是唯一的。
文件系统创建日期 不可搜索 File_system_date_created 从文件系统 (创建日期仅适用于非 Office 365 数据) 。
文件系统修改日期 不可搜索 File_system_date_modified 文件系统 (修改日期仅适用于非 Office 365 数据) 。
文件类型 FileType 未导出 基于文件扩展名的项的文件类型。
组 ID GroupId Group_ID 将电子邮件和文档的所有项目组合在一起。 对于电子邮件,这包括邮件以及所有附件和提取的项目。 对于文档,这包括文档和任何嵌入项。
具有附件 EmailHasAttachment Email_has_attachment 指示邮件是否具有附件。
有律师 HasAttorney 未导出 如果在律师列表中找到至少一个参与者,则为 True;否则,值为 False
HasText* 不可搜索 Has_text 指示项是否包含文本;可能的值为 TrueFalse
不可变 ID 不可搜索 Immutable_ID 此 ID 用于唯一标识审阅集中的文档。 此字段不能用于审阅集搜索,并且 ID 不能用于访问文档的本机位置。
非独占类型 InclusiveType Inclusive_type 为分析计算的非独占类型: 0 - 不包括; 1 - 含; 2 - 含减号; 3 - 包含副本。
在回复 ID 中 不可搜索 In_reply_to_ID 在答复消息中的 ID 时。
InputFileExtension 不可搜索 Original_file_extension 文件的原始文件扩展名。
InputFileID 不可搜索 Input_file_ID 审阅集中顶级项的文件 ID。 对于附件,此 ID 将是父级的 ID。 这可用于将家庭组合在一起。
是新式附件 IsModernAttachment 未导出 此文件是新式附件或链接文件。
来自文档版本 IsFromDocumentVersion 未导出 当前文档来自另一个文档的不同版本。
是电子邮件附件 IsEmailAttachment 未导出 此项来自电子邮件附件,该附件显示为邮件的附加项。
是内联附件 IsInlineAttachment 未导出 这是内联附加的,并显示在邮件正文中。
是代表 IsRepresentative Is_representative 每组精确重复项中的一个文档标记为代表性。
Item 类 ItemClass Item_class Exchange 服务器提供的 Item 类;例如 IPM。注意
上次修改日期 LastModifiedDate Doc_date_modified 上次修改文档元数据的日期。
加载 ID LoadId Load_ID 在其中将项添加到审阅集的加载集的 ID。
位置 位置 位置 指示文档来源位置类型的字符串。

导入的数据 - 非 Office 365 数据
Teams - Microsoft Teams
Exchange - Exchange 邮箱
SharePoint - SharePoint 网站
OneDrive - OneDrive 帐户

位置名称 LocationName Location_name 标识项源的字符串。 对于交换,这是邮箱的 SMTP 地址;对于 SharePoint 和 OneDrive,则为网站集的 URL。
N/A N/A Marked_as_pivot 此文件是接近重复集中的透视。
标记为代表 MarkAsRepresentative 未导出 每组精确重复项中的一个文档标记为代表。
会议结束日期 MeetingEndDate Meeting_end_date 会议的会议结束日期。
会议开始日期 MeetingStartDate Meeting_start_date 会议的会议开始日期。
消息类型 MessageKind Message_kind 要搜索的邮件类型。 可能的值:

contacts
文档
电子邮件
externaldata
传真
即时消息
日志
会议
microsoftteams
(从Microsoft Teams) 中的聊天、会议和通话中返回项目
notes
公告
RSS 源
tasks
语音邮件

新式附件父 ID 不可搜索 ModernAttachment_ParentId 文档父级的不可变 ID。
本机扩展 NativeExtension Native_extension 项的本机扩展。
本机文件名 NativeFileName Native_file_name 项的本机文件名。
本机文件大小 Size Native_size 本机项的字节数。
NativeMD5 不可搜索 Native_MD5 MD5 哈希 (文件流的 128 位哈希值) 。
NativeSHA256 不可搜索 Native_SHA_256 SHA256 哈希 (文件流的 256 位哈希值) 。
ND/ET 排序:排除附件 NdEtSortExclAttach ND_ET_sort_excl_attach 电子邮件线程的串联 (ET) 集和近重复 (ND) 集。 此字段用于在评审时进行高效排序。 D 以 ND 集为前缀,E 以 ET 集为前缀。
ND/ET 排序:包括附件 NdEtSortInclAttach ND_ET_sort_incl_attach 电子邮件线程的串联 (ET) 集和几乎重复 (ND) 集。 此字段用于在评审时进行高效排序。 D 以 ND 集为前缀,E 以 ET 集为前缀。 ET 集中的每个电子邮件项后跟其相应的附件。
接近重复集 不可搜索 ND_set 类似于透视文档的项目共享相同的ND_set。
O365 作者 不可搜索 O365_authors 从 SharePoint 创作。
O365 创建者 不可搜索 O365_created_by 通过 SharePoint 创建。
O365 创建日期 不可搜索 O365_date_created 创建自 SharePoint 的日期。
O365ModifiedDate 不可搜索 O365_date_modified 从 SharePoint 或 OneDrive for Business 收集的文档 (或文档版本) 修改日期。 这与 SharePoint 和 OneDrive 用户体验的版本历史记录中显示的修改日期相同。
O365 修改者 不可搜索 O365_modified_by 已从 SharePoint 或 OneDrive 修改。
其他保管人 DedupedCustodians Deduped_custodians 根据内容对电子邮件 (完全重复的文档的保管人列表;用于文档,基于哈希) 。
其他文件 ID DedupedFileIds Deduped_file_IDs 基于内容 (完全重复的文档的文件 ID 列表;用于文档,基于哈希) 。
其他路径 Dedupedcompoundpath Deduped_compound_path 在电子邮件 (完全重复的文档的复合路径列表:基于内容、文档:基于哈希) 。
父 ID ParentId Parent_ID 项的父级的 ID。
ParentNode 不可搜索 Parent_node 电子邮件线程中最近的上一封电子邮件。
参与者域 ParticipantDomains Email_participant_domains 消息参与者的所有域的列表。
参与者 参与者 Email_participants 邮件的所有参与者的列表;例如, 发件人收件人抄送密件抄送
透视表 ID PivotId Pivot_ID 透视表的 ID。
潜在特权 PotentiallyPrivileged Potentially_privileged 如此 如果律师-客户端特权检测模型认为文档可能具有特权
处理状态 ProcessingStatus Error_code 将项目添加到审阅集后的处理状态。
读取百分位数 ReadPercentile 未导出 根据相关性读取文档的百分位数。
接收时间 接收时间 Email_date_received 以 UTC 格式接收电子邮件的日期和时间。
收件人计数 不可搜索 Recipient_count 邮件中的收件人数。
收件人域 RecipientDomains Email_recipient_domains 邮件收件人的所有域的列表。
收件人 收件人 Email_recipients 邮件 (收件人、抄送、密件抄送) 的所有收件人的列表。
N/A N/A Redacted_file_path 导出中修订的替换文件的路径。
N/A N/A Redacted_text_path 导出中修订的文本文件替换的路径。 仅供内部Microsoft使用。
相关性标记案例问题 1 不可搜索 Relevance_tag_case_issue_1 相关性标记来自相关性的案例问题 1。
相关性分数 RelevanceScore 未导出 基于相关性的文档的相关性分数。
相关性标记 RelevanceTag 未导出 基于相关性的文档的相关性分数。
代表 ID RepresentativeId 未导出 每组精确重复项的数字标识符。
N/A N/A Row_number 加载文件中项的行号。
发件人 发件人 Email_sender 邮件类型的发件人 (发件人) 字段。 格式为 DisplayName <SmtpAddress>
发件人/作者 SenderAuthor 未导出 由项目的发件人或作者组成的计算字段。
发件人域 SenderDomain Email_sender_domain 发件人的域。
发件箱 发件箱 Email_date_sent 消息的发送日期。
聊天:脚本的开始日期
设置 ID 不可搜索 Set_ID 相同电子邮件线程中的类似内容 (ND_set) 文档或电子邮件 (Email_set) 共享相同的Set_ID。
设置顺序:先包含 SetOrderInclusivesFirst Set_order_inclusives_first 排序字段 - 电子邮件和附件:按时间顺序排列;documents:先按相似性分数降序透视。
SimilarityPercent 不可搜索 Similarity_percent 指示文档与接近重复集的透视点的相似程度。
主题 主题 Email_subject 邮件的主题。
主题/标题 SubjectTitle 不可搜索 由项目的主题或标题组成的计算字段。
标记 标记 标记 在审阅集中应用的标记。
工作组名称 TeamName TeamName 团队: 团队名称
Viva Engage: 社区名称
主题列表 ThemesList Themes_list 为分析计算的主题列表。
线程 ID ThreadId Thread_ID 电子邮件、Teams 对话和 Viva Engage 对话中的线程 ID。 对于电子邮件,所有答复邮件和附件共享相同的线程 ID。 对于 Teams 1:1 和群组聊天,同一对话中的所有脚本文件及其关联项目共享相同的线程 ID。 有关详细信息,请参阅 查看审阅集中的文档
标题 标题 Doc_title 文档元数据中的标题。 文档元数据中的标题。 对于 Teams 和 Viva Engage 内容,这是 ConversationName 属性中的值。
To To Email_to 消息类型的 To 字段。 格式为 DisplayName<SmtpAddress>
在电子邮件集中唯一 UniqueInEmailSet 未导出 如果电子邮件集中有附件的副本,则为 False
版本组 ID 不可搜索 Version_Group_Id 将同一文档的不同版本组合在一起。
VersionNumber 不可搜索 Version_Number 从 SharePoint 或 OneDrive for Business 收集的文档的版本号。 此版本号与 SharePoint 和 OneDrive 用户体验的版本历史记录中显示的版本号相同。
已修正 WasRemediated Was_Remediated 如果已修正项目,则为 True,否则为 False
Word count WordCount Word_count 项中的字数。