Рекомендации по форматированию импортированных документов и URL-адресов
Ознакомьтесь с указанными рекомендациями по форматированию для получения наилучших результатов для вашего содержимого.
Рекомендации по форматированию
После импорта файла или URL-адреса QnA Maker преобразует и сохраняет ваш контент в формате уценки. В процессе преобразования в текст добавляются новые строки, например \n\n
. Знание формата уценки поможет вам понять преобразованное содержимое и управлять содержимым базы знаний.
Если вы добавляете или редактируете свой контент непосредственно в базе знаний, воспользуйтесь форматированием уценки для создания расширенного текстового контента или измените содержание формата уценки, которое уже есть в ответе. QnA Maker поддерживает большую часть формата уценки, чтобы добавить в содержимое возможности форматированного текста. Тем не менее, клиентское приложение, например чат-бот, может не поддерживать тот же набор форматов уценки. Следует протестировать отображение ответов клиентским приложением.
См. полный список типов содержания и примеров.
Базовое форматирование документов
QnA Maker определяет разделы, подразделы и взаимосвязи в файле на основе таких визуальных подсказок, как:
- размер шрифта
- стиль шрифта
- нумерация
- цвета
Примечание.
В настоящее время мы не поддерживаем функцию извлечения изображений из загруженных документов.
Руководства по продукции
Руководством обычно называются справочные материалы, входящие в комплект поставки продукта. Они помогают пользователям устанавливать, использовать, обслуживать продукт и устранять возможные неполадки. Когда QnA Maker обрабатывает руководство, он извлекает заголовки и подзаголовки в качестве вопросов, а последующее содержимое — в качестве ответов. Пример вы можете найти здесь.
Ниже приведен пример руководства со страницей индексов и иерархическим содержимым
Примечание.
Извлечение лучше всего работает с руководствами с отдельным содержанием и (или) страницей индексов и хорошей иерархической структурой заголовков.
Брошюры, рекомендации, документы и другие файлы
Многие другие типы документов также могут быть обработаны для создания пар вопросов и ответов при условии, что они имеют четкую структуру и макет. К ним относятся: брошюры, руководства, отчеты, официальные документы, научные статьи, политики, книги и т. д. см. пример здесь.
Ниже приведен пример слабоструктурированного документа без индекса:
Поддержка неструктурированных документов
Пользовательские ответы на вопросы теперь поддерживают неструктурированные документы. Документ, содержимое которого не организовано четко определенным иерархическим образом, в котором отсутствует заданная структура или содержимое свободно перемещается, может рассматриваться как неструктурированный документ.
Ниже приведен пример неструктурированного PDF-документа:
В настоящее время данная функция доступна только при загрузке документов и только для форматов файлов PDF и DOC.
Внимание
Поддержка неструктурированного файла или содержимого доступна только в службе ответов на вопросы.
Документ структурированных вопросов и ответов
Формат структурированных "вопросов — ответов" в DOC-файлах представлен в чередующемся формате — по одному вопросу в строке, за которым следует ответ в следующей строке, как показано ниже.
Question1
Answer1
Question2
Answer2
Ниже приведен пример структурированного документа Word вопросов и ответов.
Структурированные TXT, TSV и XLS файлы
Вопросы и ответы в форме структурированных файлов в формате TXT, TSV или XLS также могут быть загружены в QnA Maker для создания или расширения базы знаний. Они могут быть либо обычным текстом, либо иметь содержимое в формате RTF или HTML. Пары QnA имеют необязательное поле метаданных, которое можно использовать для группирования пар QnA по категориям.
Вопрос | Ответ | Метаданные (1 ключ: 1 значение) |
---|---|---|
Question1 | Answer1 | Key1:Value1 | Key2:Value2 |
Question2 | Answer2 | Key:Value |
Все остальные столбцы в исходном файле игнорируются.
Пример структурированного файла Excel
Ниже приведен пример структурированных вопросов и ответов файла формата XLS с содержимым HTML
Пример альтернативных вопросов для единственного ответа в файле Excel
Ниже приведен пример структурированного файла QnA .xls с несколькими альтернативными вопросами для единственного ответа:
После импорта файла пара вопросов и ответов находится в базе знаний, как показано ниже:
Загрузка данных в структурированном формате через импорт
При импорте базы знаний содержимое существующей базы знаний полностью заменяется. Для импорта нужно предоставить структурированный TSV-файл с информацией об источнике данных. Эти сведения помогают QnA Maker сгруппировать пары "вопрос — ответ" и сопоставить их с конкретным источником данных. Пары QnA имеют необязательное поле метаданных, которое можно использовать для группирования пар QnA по категориям.
Вопрос | Ответ | Исходный код | Метаданные (1 ключ: 1 значение) |
---|---|---|---|
Question1 | Answer1 | Url1 | Key1:Value1 | Key2:Value2 |
Question2 | Answer2 | Редакция | Key:Value |
Многооборотное форматирование документа
- Используйте заголовки и подзаголовки для обозначения иерархии. Например, родительский QnA можно обозначить как заголовок уровня 1, а QnA, который следует использовать в качестве подсказки, — как заголовок уровня 2. Используйте заголовок меньшего размера для обозначения последующей иерархии. Не используйте стиль, цвет или какой-либо другой механизм для обозначения структуры документа, поскольку QnA Maker не будет извлекать из таких документов подсказки для диалога с несколькими шагами.
- Первый символ заголовка должен быть прописным.
- Не завершайте заголовок вопросительным знаком ("
?
").
Примеры документов:
Surface Pro (DOCX)
Преимущества Contoso (DOCX)
Преимущества Contoso (PDF)
URL-адреса вопросов и ответов
QnA Maker может поддерживать веб-страницы вопросов и ответов в трех разных формах:
- Простые страницы вопросов и ответов
- Страницы вопросов и ответов со ссылками
- Страницы часто задаваемых вопросов с главной страницей тем
Простые страницы вопросов и ответов
Это наиболее распространенный тип страниц с вопросами и ответами, в котором ответы содержатся на той же странице, сразу после каждого вопроса.
Ниже показан пример простой страницы вопросов и ответов.
Страницы вопросов и ответов со ссылками
В этом типе страниц с вопросами и ответами все вопросы собраны вместе и содержат ссылки на ответы, расположенные либо в разных разделах на той же странице, либо на разных страницах.
Ниже показан пример страницы вопросов и ответов со ссылками на разделы, которые расположенные на той же странице.
Ссылки страницы родительских тем на дочерние страницы ответов
Этот тип часто задаваемых вопросов имеет страницу тем, где каждая тема связана с соответствующим набором вопросов и ответов на отдельной странице. QnA Maker просматривает все связанные страницы, чтобы извлечь соответствующие вопросы и ответы.
Ниже приведен пример страницы тем со ссылками на разделы часто задаваемых вопросов на разных страницах.
URL-адреса для поддержки
QnA Maker может обрабатывать полуструктурированные веб-страницы поддержки, такие как статьи в Интернете, описывающие способы выполнения определенной задачи, способы диагностики и устранения проблемы и рекомендации для процесса. Извлечение лучше всего работает с документами, которые имеют четкую структуру с иерархической структурой заголовков.
Примечание.
Извлечение для статьи о поддержке — это новая функция, которая находится на ранних стадиях. Она лучше всего подходит для простых страниц, которые хорошо структурированы и не содержат сложные колонтитулы.
База знаний по импорту и экспорту
Файлы TSV и XLS из экспортированных баз знаний можно использовать только путем импорта файлов со страницы Настройки на портале QnA Maker. Их нельзя использовать в качестве источников данных во время создания базы знаний или с помощью функции Добавить файл или + Добавить URL на странице Настройки.
Когда вы импортируете базу знаний через файлы TSV и XLS, пары QnA добавляются в редакторский источник, а не в источники, из которых были извлечены QnA в экспортированной базе знаний.
Следующие шаги
См. полный список типов содержания и примеров