Sdílet prostřednictvím


Pokyny k formátování pro importované dokumenty a adresy URL

Projděte si tyto pokyny pro formátování a získejte nejlepší výsledky pro váš obsah.

Aspekty formátování

Po importu souboru nebo adresy URL služba QnA Maker převede a uloží váš obsah ve formátu markdownu. Proces převodu přidá do textu nové řádky, například \n\n. Znalost formátu markdownu vám pomůže pochopit převedený obsah a spravovat obsah znalostní báze.

Pokud obsah přidáte nebo upravíte přímo v znalostní báze, můžete pomocí formátování markdownu vytvořit obsah rtfingu nebo změnit obsah formátu markdownu, který už je v odpovědi. QnA Maker podporuje většinu formátu Markdownu, který umožňuje do obsahu přenést funkce rtfů. Klientská aplikace, například chatovací robot, ale nemusí podporovat stejnou sadu formátů markdownu. Je důležité otestovat zobrazení odpovědí klientské aplikace.

Podívejte se na úplný seznam typů obsahu a příkladů.

Základní formátování dokumentu

QnA Maker identifikuje oddíly a pododdíly a vztahy v souboru na základě vizuálních vodítek, jako jsou:

  • velikost písma
  • řez písma
  • číslování
  • barvy

Poznámka:

Momentálně nepodporujeme extrakci obrázků z nahraných dokumentů.

Příručky k produktům

Příručka je obvykle vodicí materiál, který doprovází výrobek. Pomáhá uživateli nastavit, používat, udržovat a řešit potíže s produktem. Když QnA Maker zpracuje příručku, extrahuje nadpisy a podnadpisy jako otázky a následný obsah jako odpovědi. Podívejte se na příklad zde.

Níže je příklad příručky s indexovou stránkou a hierarchickým obsahem.

Příklad příručky k produktu pro znalostní báze

Poznámka:

Extrakce je nejvhodnější pro příručky, které obsahují obsah nebo indexovou stránku, a jasnou strukturu s hierarchickými nadpisy.

Brožury, pokyny, dokumenty a další soubory

Mnoho dalších typů dokumentů lze také zpracovat a generovat páry kontroly kvality za předpokladu, že mají jasnou strukturu a rozložení. Patří sem: brožury, pokyny, zprávy, dokumenty white paper, vědecké dokumenty, politiky, knihy atd. Podívejte se na příklad zde.

Níže je příklad částečně strukturovaného dokumentu bez indexu:

Částečně strukturovaná dokumentace ke službě Azure Blob Storage

Podpora nestrukturovaných dokumentů

Vlastní odpověď na otázky teď podporuje nestrukturované dokumenty. Dokument, který nemá svůj obsah uspořádaný dobře definovaným hierarchickým způsobem, chybí nastavená struktura nebo má volný obsah, který může být považován za nestrukturovaný dokument.

Tady je příklad nestrukturovaného dokumentu PDF:

Příklad nestrukturovaného dokumentu pro znalostní báze

V současné době je tato funkce k dispozici pouze prostřednictvím nahrávání dokumentů a pouze pro formáty souborů PDF a DOC.

Důležité

Podpora nestrukturovaného souboru nebo obsahu je k dispozici pouze při odpovídání na otázky.

Strukturovaný dokument QnA

Formát strukturovaných odpovědí na otázky v souborech DOC je ve formě střídavých otázek a odpovědí na řádek, jedna otázka na řádek následovaná odpovědí na následující řádek, jak je znázorněno níže:

Question1

Answer1

Question2

Answer2

Níže je příklad strukturovaného wordového dokumentu QnA:

Příklad strukturovaného dokumentu QnA pro znalostní báze

Strukturované soubory TXT, TSV a XLS

QnAs ve formě strukturovaných .txt, souborů .tsv nebo .xls lze také nahrát do služby QnA Maker a vytvořit nebo rozšířit znalostní báze. Můžou to být prostý text nebo můžou mít obsah ve formátu RTF nebo HTML. Páry QnA mají volitelné pole metadat, které lze použít k seskupení párů QnA do kategorií.

Otázka Odpověď Metadata (1 klíč: 1 hodnota)
Otázka 1 Odpověď1 Key1:Value1 | Key2:Value2
Otázka 2 Odpověď 2 Key:Value

Všechny další sloupce ve zdrojovém souboru se ignorují.

Příklad strukturovaného excelového souboru

Níže je příklad strukturovaného souboru QnA .xls s obsahem HTML:

Příklad strukturovaného excelu QnA pro znalostní báze

Příklad alternativních otázek pro jednu odpověď v excelovém souboru

Níže je příklad strukturovaného souboru QnA .xls s několika alternativními otázkami pro jednu odpověď:

Příklad alternativních otázek pro jednu odpověď v excelovém souboru

Po importu souboru se dvojice otázek a odpovědí nachází v znalostní báze, jak je znázorněno níže:

Snímek obrazovky s alternativními dotazy pro jednu odpověď importovanou do znalostní báze

Formát strukturovaných dat prostřednictvím importu

Import znalostní báze nahradí obsah existujícího znalostní báze. Import vyžaduje strukturovaný soubor .tsv, který obsahuje informace o zdroji dat. Tyto informace pomáhají službě QnA Maker seskupit páry odpovědí na otázky a přiřazovat je konkrétnímu zdroji dat. Páry QnA mají volitelné pole metadat, které lze použít k seskupení párů QnA do kategorií.

Otázka Odpověď Zdroj Metadata (1 klíč: 1 hodnota)
Otázka 1 Odpověď1 Adresa URL1 Key1:Value1 | Key2:Value2
Otázka 2 Odpověď 2 Redakční Key:Value

Vícenásobné formátování dokumentu

  • Pomocí nadpisů a dílčích nadpisů můžete vysvětlovat hierarchii. Můžete například h1 označit nadřazenou QnA a h2 a označit QnA, která by se měla zobrazit jako výzva. K označení následující hierarchie použijte malou velikost nadpisu. Nepoužívejte styl, barvu ani jiný mechanismus, který by znamenal strukturu v dokumentu, QnA Maker nebude extrahovat výzvy s vícenásobným otáčením.
  • První znak nadpisu musí být velkými písmeny.
  • Neukončí nadpis otazníkem. ?

Ukázkové dokumenty:
Surface Pro (docx)
Výhody společnosti Contoso (docx)
Výhody společnosti Contoso (pdf)

Adresy URL nejčastějších dotazů

QnA Maker může podporovat webové stránky s nejčastějšími dotazy ve 3 různých formách:

  • Stránky s prostými nejčastějšími dotazy
  • Stránky s nejčastějšími dotazy s odkazy
  • Stránky s nejčastějšími dotazy s domovskou stránkou Témat

Stránky s prostými nejčastějšími dotazy

Toto je nejběžnější typ stránky nejčastějších dotazů, ve které odpovědi okamžitě následují otázky na stejné stránce.

Níže je příklad stránky s prostými nejčastějšími dotazy:

Příklad stránky s prostými nejčastějšími dotazy pro znalostní báze

V tomto typu stránky s nejčastějšími dotazy jsou otázky agregované společně a jsou propojeny s odpověďmi, které jsou buď v různých oddílech stejné stránky, nebo na různých stránkách.

Níže je příklad stránky s nejčastějšími dotazy s odkazy v oddílech, které jsou na stejné stránce:

Příklad stránky nejčastějších dotazů k oddílu pro znalostní báze

Tento typ nejčastějších dotazů obsahuje stránku Témata, kde je každé téma propojeno s odpovídající sadou otázek a odpovědí na jiné stránce. QnA Maker prochází všechny propojené stránky a extrahuje odpovídající otázky a odpovědi.

Níže je příklad stránky Témata s odkazy na oddíly s nejčastějšími dotazy na různých stránkách.

Příklad stránky s nejčastějšími dotazy k odkazu na znalostní báze

Adresy URL podpory

Služba QnA Maker může zpracovávat částečně strukturované webové stránky podpory, jako jsou webové články, které popisují, jak provést danou úlohu, jak diagnostikovat a vyřešit daný problém a jaké jsou osvědčené postupy pro daný proces. Extrakce funguje nejlépe u obsahu, který má jasnou strukturu s hierarchickými nadpisy.

Poznámka:

Extrakce článků podpory je nová funkce a je v počátečních fázích. Nejvhodnější je pro jednoduché stránky, které jsou dobře strukturované a neobsahují složitá záhlaví a zápatí.

QnA Maker podporuje extrakci z částečně strukturovaných webových stránek, kde se zobrazí jasná struktura s hierarchickými nadpisy.

Import a export znalostní báze

Soubory TSV a XLS z exportovaných znalostní báze je možné použít pouze importem souborů ze stránky Nastavení na portálu QnA Maker. Nejde je použít jako zdroje dat během vytváření znalostní báze ani pomocí funkce + Přidat soubor nebo + Přidat adresu URL na stránce Nastavení.

Při importu znalostní báze prostřednictvím těchto souborů TSV a XLS se páry QnA přidají do redakčního zdroje a ne ke zdrojům, ze kterých byly qnA extrahovány v exportované znalostní bázi.

Další kroky

Zobrazení úplného seznamu typů obsahu a příkladů