Pokyny k formátování pro importované dokumenty a adresy URL
Projděte si tyto pokyny pro formátování a získejte nejlepší výsledky pro váš obsah.
Aspekty formátování
Po importu souboru nebo adresy URL služba QnA Maker převede a uloží váš obsah ve formátu markdownu. Proces převodu přidá do textu nové řádky, například \n\n
. Znalost formátu markdownu vám pomůže pochopit převedený obsah a spravovat obsah znalostní báze.
Pokud obsah přidáte nebo upravíte přímo v znalostní báze, můžete pomocí formátování markdownu vytvořit obsah rtfingu nebo změnit obsah formátu markdownu, který už je v odpovědi. QnA Maker podporuje většinu formátu Markdownu, který umožňuje do obsahu přenést funkce rtfů. Klientská aplikace, například chatovací robot, ale nemusí podporovat stejnou sadu formátů markdownu. Je důležité otestovat zobrazení odpovědí klientské aplikace.
Podívejte se na úplný seznam typů obsahu a příkladů.
Základní formátování dokumentu
QnA Maker identifikuje oddíly a pododdíly a vztahy v souboru na základě vizuálních vodítek, jako jsou:
- velikost písma
- řez písma
- číslování
- barvy
Poznámka:
Momentálně nepodporujeme extrakci obrázků z nahraných dokumentů.
Příručky k produktům
Příručka je obvykle vodicí materiál, který doprovází výrobek. Pomáhá uživateli nastavit, používat, udržovat a řešit potíže s produktem. Když QnA Maker zpracuje příručku, extrahuje nadpisy a podnadpisy jako otázky a následný obsah jako odpovědi. Podívejte se na příklad zde.
Níže je příklad příručky s indexovou stránkou a hierarchickým obsahem.
Poznámka:
Extrakce je nejvhodnější pro příručky, které obsahují obsah nebo indexovou stránku, a jasnou strukturu s hierarchickými nadpisy.
Brožury, pokyny, dokumenty a další soubory
Mnoho dalších typů dokumentů lze také zpracovat a generovat páry kontroly kvality za předpokladu, že mají jasnou strukturu a rozložení. Patří sem: brožury, pokyny, zprávy, dokumenty white paper, vědecké dokumenty, politiky, knihy atd. Podívejte se na příklad zde.
Níže je příklad částečně strukturovaného dokumentu bez indexu:
Podpora nestrukturovaných dokumentů
Vlastní odpověď na otázky teď podporuje nestrukturované dokumenty. Dokument, který nemá svůj obsah uspořádaný dobře definovaným hierarchickým způsobem, chybí nastavená struktura nebo má volný obsah, který může být považován za nestrukturovaný dokument.
Tady je příklad nestrukturovaného dokumentu PDF:
V současné době je tato funkce k dispozici pouze prostřednictvím nahrávání dokumentů a pouze pro formáty souborů PDF a DOC.
Důležité
Podpora nestrukturovaného souboru nebo obsahu je k dispozici pouze při odpovídání na otázky.
Strukturovaný dokument QnA
Formát strukturovaných odpovědí na otázky v souborech DOC je ve formě střídavých otázek a odpovědí na řádek, jedna otázka na řádek následovaná odpovědí na následující řádek, jak je znázorněno níže:
Question1
Answer1
Question2
Answer2
Níže je příklad strukturovaného wordového dokumentu QnA:
Strukturované soubory TXT, TSV a XLS
QnAs ve formě strukturovaných .txt, souborů .tsv nebo .xls lze také nahrát do služby QnA Maker a vytvořit nebo rozšířit znalostní báze. Můžou to být prostý text nebo můžou mít obsah ve formátu RTF nebo HTML. Páry QnA mají volitelné pole metadat, které lze použít k seskupení párů QnA do kategorií.
Otázka | Odpověď | Metadata (1 klíč: 1 hodnota) |
---|---|---|
Otázka 1 | Odpověď1 | Key1:Value1 | Key2:Value2 |
Otázka 2 | Odpověď 2 | Key:Value |
Všechny další sloupce ve zdrojovém souboru se ignorují.
Příklad strukturovaného excelového souboru
Níže je příklad strukturovaného souboru QnA .xls s obsahem HTML:
Příklad alternativních otázek pro jednu odpověď v excelovém souboru
Níže je příklad strukturovaného souboru QnA .xls s několika alternativními otázkami pro jednu odpověď:
Po importu souboru se dvojice otázek a odpovědí nachází v znalostní báze, jak je znázorněno níže:
Formát strukturovaných dat prostřednictvím importu
Import znalostní báze nahradí obsah existujícího znalostní báze. Import vyžaduje strukturovaný soubor .tsv, který obsahuje informace o zdroji dat. Tyto informace pomáhají službě QnA Maker seskupit páry odpovědí na otázky a přiřazovat je konkrétnímu zdroji dat. Páry QnA mají volitelné pole metadat, které lze použít k seskupení párů QnA do kategorií.
Otázka | Odpověď | Zdroj | Metadata (1 klíč: 1 hodnota) |
---|---|---|---|
Otázka 1 | Odpověď1 | Adresa URL1 | Key1:Value1 | Key2:Value2 |
Otázka 2 | Odpověď 2 | Redakční | Key:Value |
Vícenásobné formátování dokumentu
- Pomocí nadpisů a dílčích nadpisů můžete vysvětlovat hierarchii. Můžete například h1 označit nadřazenou QnA a h2 a označit QnA, která by se měla zobrazit jako výzva. K označení následující hierarchie použijte malou velikost nadpisu. Nepoužívejte styl, barvu ani jiný mechanismus, který by znamenal strukturu v dokumentu, QnA Maker nebude extrahovat výzvy s vícenásobným otáčením.
- První znak nadpisu musí být velkými písmeny.
- Neukončí nadpis otazníkem.
?
Ukázkové dokumenty:
Surface Pro (docx)
Výhody společnosti Contoso (docx)
Výhody společnosti Contoso (pdf)
Adresy URL nejčastějších dotazů
QnA Maker může podporovat webové stránky s nejčastějšími dotazy ve 3 různých formách:
- Stránky s prostými nejčastějšími dotazy
- Stránky s nejčastějšími dotazy s odkazy
- Stránky s nejčastějšími dotazy s domovskou stránkou Témat
Stránky s prostými nejčastějšími dotazy
Toto je nejběžnější typ stránky nejčastějších dotazů, ve které odpovědi okamžitě následují otázky na stejné stránce.
Níže je příklad stránky s prostými nejčastějšími dotazy:
Stránky s nejčastějšími dotazy s odkazy
V tomto typu stránky s nejčastějšími dotazy jsou otázky agregované společně a jsou propojeny s odpověďmi, které jsou buď v různých oddílech stejné stránky, nebo na různých stránkách.
Níže je příklad stránky s nejčastějšími dotazy s odkazy v oddílech, které jsou na stejné stránce:
Odkazy na podřízené stránky s odkazy na podřízené stránky témat
Tento typ nejčastějších dotazů obsahuje stránku Témata, kde je každé téma propojeno s odpovídající sadou otázek a odpovědí na jiné stránce. QnA Maker prochází všechny propojené stránky a extrahuje odpovídající otázky a odpovědi.
Níže je příklad stránky Témata s odkazy na oddíly s nejčastějšími dotazy na různých stránkách.
Adresy URL podpory
Služba QnA Maker může zpracovávat částečně strukturované webové stránky podpory, jako jsou webové články, které popisují, jak provést danou úlohu, jak diagnostikovat a vyřešit daný problém a jaké jsou osvědčené postupy pro daný proces. Extrakce funguje nejlépe u obsahu, který má jasnou strukturu s hierarchickými nadpisy.
Poznámka:
Extrakce článků podpory je nová funkce a je v počátečních fázích. Nejvhodnější je pro jednoduché stránky, které jsou dobře strukturované a neobsahují složitá záhlaví a zápatí.
Import a export znalostní báze
Soubory TSV a XLS z exportovaných znalostní báze je možné použít pouze importem souborů ze stránky Nastavení na portálu QnA Maker. Nejde je použít jako zdroje dat během vytváření znalostní báze ani pomocí funkce + Přidat soubor nebo + Přidat adresu URL na stránce Nastavení.
Při importu znalostní báze prostřednictvím těchto souborů TSV a XLS se páry QnA přidají do redakčního zdroje a ne ke zdrojům, ze kterých byly qnA extrahovány v exportované znalostní bázi.
Další kroky
Zobrazení úplného seznamu typů obsahu a příkladů