电子数据展示(高级)中的文档元数据字段
提示
电子数据展示 (预览) 现已在新的 Microsoft Purview 门户中提供。 若要详细了解如何使用新的电子数据展示体验,请参阅 了解电子数据展示 (预览版) 。
下表列出了在 Microsoft Purview 电子数据展示 (Premium) 中,审阅集中文档的元数据字段。 有关在收集电子数据展示 (Premium) 事例的数据时搜索Microsoft 365 内容位置时可搜索属性的详细信息,请参阅 内容搜索的关键字查询和搜索条件。
此表提供以下信息:
- 字段名称和显示字段名称:在审阅集中查看所选文档的文件元数据时,元数据字段的名称和显示字段的名称。 查看文档的文件元数据时,不包含某些元数据字段。 这些字段以星号 (*) 突出显示。
- 可搜索字段名称: 运行 审阅集查询时可以搜索的属性的名称。
- 导出的字段名称: 导出文档时包含的元数据字段的名称。
- 描述: 元数据字段的说明。
注意
审阅集搜索中的“关键字”字段使用关键字查询语言 (KQL) 。 “ 可搜索字段名称 ”列中列出的字段可以在审阅集搜索的 “关键字” 字段中使用,以形成复杂查询,而无需使用查询生成器。 有关 KQL 的详细信息,请参阅 关键字查询语言语法参考。
字段名称和显示字段名称 | 可搜索字段名称 | 导出的字段名称 | 说明 |
---|---|---|---|
附件内容 ID | AttachmentContentId | 未导出 | 项目的附件内容 ID。 |
律师客户特权分数 | AttorneyClientPrivilegeScore | 未导出 | 律师-客户端特权模型内容分数。 |
作者 | 作者 | Doc_authors | 从文档元数据创作。 |
BCC | Bcc | Email_bcc | 消息类型的密件抄送字段。 格式为 DisplayName <SMTPAddress>。 |
CC | Cc | Email_cc | 邮件类型的抄送字段。 格式为 DisplayName <SMTPAddress>。 |
通道名称 | 频道 | ChannelName | 此字段是 Teams 频道名称。 仅适用于Microsoft Teams 内容。 |
合规性标签 | ComplianceLabels | Compliance_labels | 应用于 Office 365 中内容的保留标签。 |
复合路径 | CompoundPath | Compound_path | 描述项源的人类可读路径。 |
内容* | 内容 | 未导出 | 提取项的文本。 |
对话正文 | ConversationBody | 未导出 | 项的对话正文。 |
对话 ID | ConversationId | Conversation_ID | 消息中的对话 ID。 对于 Teams 1:1 和群组聊天,同一对话中的所有脚本文件及其家庭项目共享相同的对话 ID。 有关详细信息,请参阅 Microsoft Teams 中内容的电子数据展示 (Premium) 工作流。 |
对话家庭 ID | ConversationFamilyID | ConversationFamilyID | 标识会话的各个元素和会话中的相关项的 ID。 |
对话索引 | 不可搜索 | Conversation_index | 邮件中的对话索引。 |
对话名称 | 不可搜索 | ConversationName | 此字段取决于内容类型。 Teams 1:1 聊天: 第一条消息的前 40 个字符。 Teams 1:N 聊天: 群组聊天的名称;如果不可用,则为第一条消息的前 40 个字符。 Teams 频道帖子: 帖子标题或公告副标题;如果不可用,则为第一条消息的前 40 个字符。 |
对话 Pdf 时间 | ConversationPdfTime | 未导出 | 创建对话的 PDF 版本的日期。 |
对话修订刻录时间 | ConversationRedactionBurnTime | 未导出 | 为聊天创建对话的 PDF 版本的日期。 |
对话主题 | ConversationTopic | 未导出 | 项的对话主题。 |
对话类型 | ConversationType | ConversationType | 聊天对话的类型。 值为: Teams 1:1 和群组聊天以及所有 Viva Engage 对话: 群 Teams 频道和专用频道: 渠道 |
包含已删除的消息 | ContainsDeletedMessage | ContainsDeletedMessage | 指示聊天脚本是否包含已删除的消息 |
包含已编辑的消息 | ContainsEditedMessage | ContainsEditedMessage | 指示聊天脚本是否包含已编辑的消息 |
Teams 公告标题 | TeamsAnnouncementTitle | TeamsAnnouncementTitle | 团队公告的标题。 |
N/A | N/A | Converted_file_path | 转换后的导出文件的路径。 仅供内部Microsoft使用。 |
Custodian | Custodian | Custodian | 与项目关联的保管人的名称。 |
日期 | 日期 | 日期 | 日期是依赖于文件类型的计算字段。
电子邮件:发送日期 |
文档注释 | DocComments | Doc_comments | 来自文档元数据的注释。 |
文档公司 | 不可搜索 | Doc_company | 文档元数据中的公司。 |
文档创建日期 | CreatedTime | Doc_date_created | 从文档元数据创建日期。 |
DocIndex* | 不可搜索 | 未导出 | 系列中的索引。 -1 或 0 表示它是根。 |
文档关键字 | 不可搜索 | Doc_keywords | 文档元数据中的关键字。 |
文档修改者 | 不可搜索 | Doc_modified_by | 上次从文档元数据修改文档的用户。 |
文档修订 | Doc_Version | Doc_Version | 从文档元数据进行修订。 |
文档主题 | 不可搜索 | Doc_subject | 文档元数据中的主题。 |
文档模板 | 不可搜索 | Doc_template | 文档元数据中的模板。 |
DocLastSavedBy | 不可搜索 | Doc_last_saved_by | 上次保存文档的用户的名称。 |
主导主题 | DominantTheme | Dominant_theme | 为分析计算的主导主题。 |
重复子集 | 不可搜索 | Duplicate_subset | 确切重复项的组 ID。 |
EmailAction* | 不可搜索 | Email_action | 值为 None、 Reply 或 Forward;基于邮件的主题行。 |
请求的电子邮件送达回执 | 不可搜索 | Email_delivery_receipt | 用于送达回执的 Internet 标头中提供的电子邮件地址。 |
重要性 | EmailImportance | Email_importance | 消息的重要性: 0 - 低; 1 - 正常; 2 - 高 |
忽略处理错误 | ErrorIgnored | Error_Ignored | 错误被忽略且未修正。 |
EmailInternetHeaders | EmailInternetHeaders | Email_internet_headers | 电子邮件中完整的电子邮件标头集 |
EmailLevel* | 不可搜索 | Email_level | 指示邮件所属的电子邮件线程中的级别;附件继承其父邮件的值。 |
电子邮件 ID | 不可搜索 | Email_message_ID | 消息中的 Internet 消息 ID。 |
EmailReadReceiptRequested | 不可搜索 | Email_read_receipt | Internet 标头中提供的电子邮件地址,用于阅读回执。 |
电子邮件安全性 | EmailSecurity | Email_security | 消息的安全设置: 0 - 无; 1 - 已签名; 2 - 加密; 3 - 加密和签名。 |
电子邮件敏感度 | EmailSensitivity | email_sensitivity | 消息的敏感度设置: 0 - 无; 1 个人; 2 - 专用; 3 - CompanyConfidential。 |
电子邮件集 | EmailSet | Email_set | 同一电子邮件集中所有邮件的组 ID。 |
EmailThread* | 不可搜索 | Email_thread | 邮件在电子邮件集中的位置;由从根消息到当前消息的节点 ID 组成,由句点 (.) 分隔。 |
N/A | N/A | Export_native_path | 导出文件的路径。 |
提取的内容类型 | 不可搜索 | Native_type | 提取的内容类型,以 mime 类型的形式;例如 ,image/jpeg |
N/A | N/A | Extracted_text_path | 导出中提取的文本文件的路径。 |
ExtractedTextLength* | 不可搜索 | Extracted_text_length | 提取的文本中的字符数。 |
FamilyDuplicateSet* | 不可搜索 | Family_duplicate_set | (相同内容和所有相同附件) 完全重复的系列的数字标识符。 |
家庭 ID | FamilyId | Family_ID | 将附件和从电子邮件中提取的项目分组在一起,并与其父项聊天。 这包括聊天或电子邮件以及所有附件和提取的项目。 |
家庭大小 | 不可搜索 | Family_size | 系列中的文档数。 |
文件类 | FileClass | File_class | 对于 SharePoint 和 OneDrive 中的内容: 文档。 对于来自 Exchange 的内容: 电子邮件 或 附件。 对于 Teams 或 Viva Engage: 对话中的内容。 |
文件 ID | FileId | File_ID | 文档标识符在事例中是唯一的。 |
文件系统创建日期 | 不可搜索 | File_system_date_created | 从文件系统 (创建日期仅适用于非 Office 365 数据) 。 |
文件系统修改日期 | 不可搜索 | File_system_date_modified | 文件系统 (修改日期仅适用于非 Office 365 数据) 。 |
文件类型 | FileType | 未导出 | 基于文件扩展名的项的文件类型。 |
组 ID | GroupId | Group_ID | 将电子邮件和文档的所有项目组合在一起。 对于电子邮件,这包括邮件以及所有附件和提取的项目。 对于文档,这包括文档和任何嵌入项。 |
具有附件 | EmailHasAttachment | Email_has_attachment | 指示邮件是否具有附件。 |
有律师 | HasAttorney | 未导出 | 如果在律师列表中找到至少一个参与者,则为 True;否则,值为 False。 |
HasText* | 不可搜索 | Has_text | 指示项是否包含文本;可能的值为 True 和 False。 |
不可变 ID | 不可搜索 | Immutable_ID | 此 ID 用于唯一标识审阅集中的文档。 此字段不能用于审阅集搜索,并且 ID 不能用于访问文档的本机位置。 |
非独占类型 | InclusiveType | Inclusive_type | 为分析计算的非独占类型: 0 - 不包括; 1 - 含; 2 - 含减号; 3 - 包含副本。 |
在回复 ID 中 | 不可搜索 | In_reply_to_ID | 在答复消息中的 ID 时。 |
InputFileExtension | 不可搜索 | Original_file_extension | 文件的原始文件扩展名。 |
InputFileID | 不可搜索 | Input_file_ID | 审阅集中顶级项的文件 ID。 对于附件,此 ID 将是父级的 ID。 这可用于将家庭组合在一起。 |
是新式附件 | IsModernAttachment | 未导出 | 此文件是新式附件或链接文件。 |
来自文档版本 | IsFromDocumentVersion | 未导出 | 当前文档来自另一个文档的不同版本。 |
是电子邮件附件 | IsEmailAttachment | 未导出 | 此项来自电子邮件附件,该附件显示为邮件的附加项。 |
是内联附件 | IsInlineAttachment | 未导出 | 这是内联附加的,并显示在邮件正文中。 |
是代表 | IsRepresentative | Is_representative | 每组精确重复项中的一个文档标记为代表性。 |
Item 类 | ItemClass | Item_class | Exchange 服务器提供的 Item 类;例如 IPM。注意 |
上次修改日期 | LastModifiedDate | Doc_date_modified | 上次修改文档元数据的日期。 |
加载 ID | LoadId | Load_ID | 在其中将项添加到审阅集的加载集的 ID。 |
位置 | 位置 | 位置 | 指示文档来源位置类型的字符串。
导入的数据 - 非 Office 365 数据 |
位置名称 | LocationName | Location_name | 标识项源的字符串。 对于交换,这是邮箱的 SMTP 地址;对于 SharePoint 和 OneDrive,则为网站集的 URL。 |
N/A | N/A | Marked_as_pivot | 此文件是接近重复集中的透视。 |
标记为代表 | MarkAsRepresentative | 未导出 | 每组精确重复项中的一个文档标记为代表。 |
会议结束日期 | MeetingEndDate | Meeting_end_date | 会议的会议结束日期。 |
会议开始日期 | MeetingStartDate | Meeting_start_date | 会议的会议开始日期。 |
消息类型 | MessageKind | Message_kind | 要搜索的邮件类型。 可能的值: contacts |
新式附件父 ID | 不可搜索 | ModernAttachment_ParentId | 文档父级的不可变 ID。 |
本机扩展 | NativeExtension | Native_extension | 项的本机扩展。 |
本机文件名 | NativeFileName | Native_file_name | 项的本机文件名。 |
本机文件大小 | Size | Native_size | 本机项的字节数。 |
NativeMD5 | 不可搜索 | Native_MD5 | MD5 哈希 (文件流的 128 位哈希值) 。 |
NativeSHA256 | 不可搜索 | Native_SHA_256 | SHA256 哈希 (文件流的 256 位哈希值) 。 |
ND/ET 排序:排除附件 | NdEtSortExclAttach | ND_ET_sort_excl_attach | 电子邮件线程的串联 (ET) 集和近重复 (ND) 集。 此字段用于在评审时进行高效排序。 D 以 ND 集为前缀,E 以 ET 集为前缀。 |
ND/ET 排序:包括附件 | NdEtSortInclAttach | ND_ET_sort_incl_attach | 电子邮件线程的串联 (ET) 集和几乎重复 (ND) 集。 此字段用于在评审时进行高效排序。 D 以 ND 集为前缀,E 以 ET 集为前缀。 ET 集中的每个电子邮件项后跟其相应的附件。 |
接近重复集 | 不可搜索 | ND_set | 类似于透视文档的项目共享相同的ND_set。 |
O365 作者 | 不可搜索 | O365_authors | 从 SharePoint 创作。 |
O365 创建者 | 不可搜索 | O365_created_by | 通过 SharePoint 创建。 |
O365 创建日期 | 不可搜索 | O365_date_created | 创建自 SharePoint 的日期。 |
O365ModifiedDate | 不可搜索 | O365_date_modified | 从 SharePoint 或 OneDrive for Business 收集的文档 (或文档版本) 修改日期。 这与 SharePoint 和 OneDrive 用户体验的版本历史记录中显示的修改日期相同。 |
O365 修改者 | 不可搜索 | O365_modified_by | 已从 SharePoint 或 OneDrive 修改。 |
其他保管人 | DedupedCustodians | Deduped_custodians | 根据内容对电子邮件 (完全重复的文档的保管人列表;用于文档,基于哈希) 。 |
其他文件 ID | DedupedFileIds | Deduped_file_IDs | 基于内容 (完全重复的文档的文件 ID 列表;用于文档,基于哈希) 。 |
其他路径 | Dedupedcompoundpath | Deduped_compound_path | 在电子邮件 (完全重复的文档的复合路径列表:基于内容、文档:基于哈希) 。 |
父 ID | ParentId | Parent_ID | 项的父级的 ID。 |
ParentNode | 不可搜索 | Parent_node | 电子邮件线程中最近的上一封电子邮件。 |
参与者域 | ParticipantDomains | Email_participant_domains | 消息参与者的所有域的列表。 |
参与者 | 参与者 | Email_participants | 邮件的所有参与者的列表;例如, 发件人、 收件人、 抄送、 密件抄送。 |
透视表 ID | PivotId | Pivot_ID | 透视表的 ID。 |
潜在特权 | PotentiallyPrivileged | Potentially_privileged | 如此 如果律师-客户端特权检测模型认为文档可能具有特权 |
处理状态 | ProcessingStatus | Error_code | 将项目添加到审阅集后的处理状态。 |
读取百分位数 | ReadPercentile | 未导出 | 根据相关性读取文档的百分位数。 |
接收时间 | 接收时间 | Email_date_received | 以 UTC 格式接收电子邮件的日期和时间。 |
收件人计数 | 不可搜索 | Recipient_count | 邮件中的收件人数。 |
收件人域 | RecipientDomains | Email_recipient_domains | 邮件收件人的所有域的列表。 |
收件人 | 收件人 | Email_recipients | 邮件 (收件人、抄送、密件抄送) 的所有收件人的列表。 |
N/A | N/A | Redacted_file_path | 导出中修订的替换文件的路径。 |
N/A | N/A | Redacted_text_path | 导出中修订的文本文件替换的路径。 仅供内部Microsoft使用。 |
相关性标记案例问题 1 | 不可搜索 | Relevance_tag_case_issue_1 | 相关性标记来自相关性的案例问题 1。 |
相关性分数 | RelevanceScore | 未导出 | 基于相关性的文档的相关性分数。 |
相关性标记 | RelevanceTag | 未导出 | 基于相关性的文档的相关性分数。 |
代表 ID | RepresentativeId | 未导出 | 每组精确重复项的数字标识符。 |
N/A | N/A | Row_number | 加载文件中项的行号。 |
发件人 | 发件人 | Email_sender | 邮件类型的发件人 (发件人) 字段。 格式为 DisplayName <SmtpAddress>。 |
发件人/作者 | SenderAuthor | 未导出 | 由项目的发件人或作者组成的计算字段。 |
发件人域 | SenderDomain | Email_sender_domain | 发件人的域。 |
发件箱 | 发件箱 | Email_date_sent | 消息的发送日期。 聊天:脚本的开始日期 |
设置 ID | 不可搜索 | Set_ID | 相同电子邮件线程中的类似内容 (ND_set) 文档或电子邮件 (Email_set) 共享相同的Set_ID。 |
设置顺序:先包含 | SetOrderInclusivesFirst | Set_order_inclusives_first | 排序字段 - 电子邮件和附件:按时间顺序排列;documents:先按相似性分数降序透视。 |
SimilarityPercent | 不可搜索 | Similarity_percent | 指示文档与接近重复集的透视点的相似程度。 |
主题 | 主题 | Email_subject | 邮件的主题。 |
主题/标题 | SubjectTitle | 不可搜索 | 由项目的主题或标题组成的计算字段。 |
标记 | 标记 | 标记 | 在审阅集中应用的标记。 |
工作组名称 | TeamName | TeamName |
团队: 团队名称 Viva Engage: 社区名称 |
主题列表 | ThemesList | Themes_list | 为分析计算的主题列表。 |
线程 ID | ThreadId | Thread_ID | 电子邮件、Teams 对话和 Viva Engage 对话中的线程 ID。 对于电子邮件,所有答复邮件和附件共享相同的线程 ID。 对于 Teams 1:1 和群组聊天,同一对话中的所有脚本文件及其关联项目共享相同的线程 ID。 有关详细信息,请参阅 查看审阅集中的文档。 |
标题 | 标题 | Doc_title | 文档元数据中的标题。 文档元数据中的标题。 对于 Teams 和 Viva Engage 内容,这是 ConversationName 属性中的值。 |
To | To | Email_to | 消息类型的 To 字段。 格式为 DisplayName<SmtpAddress> |
在电子邮件集中唯一 | UniqueInEmailSet | 未导出 | 如果电子邮件集中有附件的副本,则为 False。 |
版本组 ID | 不可搜索 | Version_Group_Id | 将同一文档的不同版本组合在一起。 |
VersionNumber | 不可搜索 | Version_Number | 从 SharePoint 或 OneDrive for Business 收集的文档的版本号。 此版本号与 SharePoint 和 OneDrive 用户体验的版本历史记录中显示的版本号相同。 |
已修正 | WasRemediated | Was_Remediated | 如果已修正项目,则为 True,否则为 False。 |
Word count | WordCount | Word_count | 项中的字数。 |