你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
导入的文档和 URL 的格式准则
查看这些格式设置准则,以获取内容的最佳结果。
格式设置注意事项
导入文件或 URL 后,QnA Maker 以 Markdown 格式转换和存储内容。 转换过程会在文本中添加新行,例如 \n\n
。 了解 Markdown 格式有助于理解转换后的内容和管理知识库内容。
如果直接在知识库中添加或编辑内容,请使用 Markdown 格式创建丰富的文本内容,或者更改答案中已有的 Markdown 格式内容。 QnA Maker 支持大部分 Markdown 格式,为内容提供了丰富的文本功能。 但客户端应用程序(如聊天机器人)支持的 Markdown 格式集可能有所不同。 应测试客户端应用程序的答案显示,这很重要。
请参阅内容类型和示例的完整列表。
基本文档格式设置
QnA Maker 根据类似以下的视觉线索来确定文件中的节、子节和关系:
- 字体大小
- 字体样式
- 编号
- 颜色
注意
目前不支持从上传的文档中提取图像。
产品手册
手册通常是产品附带的指导材料。 它可以帮助用户设置、使用、维护产品和排除产品故障。 当 QnA Maker 处理手册时,它会将标题和副标题作为问题提取,将后续内容作为答案提取。 请参阅此处的示例。
下面是一个手册示例,其中包含索引页和分层内容。
注意
提取最适用于具有目录和/或索引页的手册,以及具有分层标题的清晰结构。
小册子、指南、论文和其他文件
许多其他类型的文档也可进行处理,以便生成 QA 对,前提是它们有清晰的结构和布局。 其中包括:小册子、指南、报告、白皮书、科学论文、策略、书籍等。请参见此处的示例。
下面是一个半结构化文档的示例,没有索引:
非结构化文档支持
自定义问答现在支持非结构化文档。 未以明确定义的分层方式组织其内容、缺少固定结构或其内容会自由流动的文档可被视为非结构化文档。
下面是非结构化 PDF 文档的示例:
目前,此功能只能通过上传文档的方式提供,并且仅适用于 PDF 和 DOC 文件格式。
重要
对非结构化文件/内容的支持仅在自定义问答(预览版)中提供。
结构化 QnA 文档
DOC 文件中结构化问答的格式采用每行都有交替的问题和回答的形式,一个问题占据一行,后面的一行是其回答,如下所示:
Question1
Answer1
Question2
Answer2
下面是结构化 QnA Word 文档的示例:
结构化 TXT、TSV 和 XLS 文件
采用结构化 .txt、.tsv 或 .xls 文件形式的 QnA 也可上传到 QnA Maker,以便创建或增强知识库。 它们的内容可以是纯文本,也可以是 RTF 或 HTML 格式。 QnA 对具有一个可选的元数据字段,可用于将 QnA 对归为不同类别。
问题 | Answer | 元数据(1 个键:1 个值) |
---|---|---|
问题 1 | 答案 1 | Key1:Value1 | Key2:Value2 |
问题 2 | 答案 2 | Key:Value |
将忽略源文件中的任何其他列。
结构化 Excel 文件的示例
下面是结构化 QnA .xls 文件的示例,包含 HTML 内容:
Excel 文件中单个答案的替代问题示例
下面是一个结构化 QnA .xls 文件示例,其中一个答案有多个替代问题:
导入文件后,问答对在知识库中显示,如下所示:
通过导入提供的结构化数据格式
导入知识库将替换现有知识库的内容。 导入需要包含数据源信息的结构化 .tsv 文件。 这些信息可帮助 QnA Maker 将问答对分组,并将它们归因于特定数据源。 QnA 对具有一个可选的元数据字段,可用于将 QnA 对归为不同类别。
问题 | Answer | 源 | 元数据(1 个键:1 个值) |
---|---|---|---|
问题 1 | 答案 1 | Url1 | Key1:Value1 | Key2:Value2 |
问题 2 | 答案 2 | 编辑 | Key:Value |
多回合文档格式设置
- 使用标题和子标题来表示层次结构。 例如,可以使用 h1 来表示父 QnA,使用 h2 来表示应用作提示的 QnA。 使用较小的标题大小来表示后续层次结构。 不要使用样式、颜色或一些其他机制来表示文档中的结构,QnA Maker 不会提取多回合提示。
- 标题的第一个字符必须采用大写形式。
- 不要以问号
?
结束标题。
示例文档:
Surface Pro (docx)
Contoso Benefits (docx)
Contoso Benefits (pdf)
常见问题解答 URL
QnA Maker 可以支持 3 种不同形式的常见问题解答网页:
- 纯文本常见问题解答页
- 带链接的常见问题解答页
- 带主题主页的常见问题解答页
纯文本常见问题解答页
这是最常见的常见问题解答页类型,其中答案会紧跟在同一页中的问题后面。
下面是普通常见问题解答页的示例:
带链接的常见问题解答页
在这种类型的常见问题解答页中,问题聚合在一起,并链接到同一页的不同部分或不同页中的答案。
下面的示例是一个常见问题解答页,其中的链接位于同一页上的不同部分:
与子答案页面链接的父主题页面
此类型的常见问题解答有一个主题页面,其中每个主题都链接到不同页面上相应的一组问题和答案。 QnA Maker 会抓取所有链接的页以提取相应的问题与答案。
下面是主题页面的示例,其中包含指向不同页面中常见问题解答部分的链接。
支持 URL
QnA Maker 可以处理半结构化支持网页,例如,介绍如何执行给定任务、如何诊断和解决给定问题以及适用于给定流程的最佳做法的网文。 提取最适用于结构清晰且具有分层标题的文档。
注意
提取支持文章是一项新功能,并且处于早期阶段。 它最适用于结构良好且未包含复杂页眉/页脚的简单页面。
导入和导出知识库
只能通过从 QnA Maker 门户的“设置”页导入文件来使用导出的知识库中的 TSV 和 XLS 文件 。 在知识库创建期间无法将其作为数据源使用,也无法通过“设置”页上的“+ 添加文件”或“+ 添加 URL”功能使用 。
通过这些 TSV 和 XLS 文件导入知识库时,会将 QnA 对添加到编辑源中,而不是添加到从导出的知识库中提取 QnA 的源中。
后续步骤
请参阅内容类型和示例的完整列表