Wytyczne dotyczące formatowania importowanych dokumentów i adresów URL
Zapoznaj się z tymi wytycznymi dotyczącymi formatowania, aby uzyskać najlepsze wyniki dla zawartości.
Zagadnienia dotyczące formatowania
Po zaimportowaniu pliku lub adresu URL usługa QnA Maker konwertuje i przechowuje zawartość w formacie markdown. Proces konwersji dodaje nowe wiersze w tekście, takie jak \n\n
. Znajomość formatu markdown pomaga zrozumieć przekonwertowaną zawartość i zarządzać zawartością baza wiedzy.
Jeśli dodasz lub edytujesz zawartość bezpośrednio w baza wiedzy, użyj formatowania markdown, aby utworzyć zawartość tekstu sformatowanego lub zmienić zawartość formatu markdown, która jest już w odpowiedzi. Usługa QnA Maker obsługuje znaczną część formatu języka znaczników Markdown, aby zapewnić możliwości tekstu sformatowanego do zawartości. Jednak aplikacja kliencka, taka jak czatbot, może nie obsługiwać tego samego zestawu formatów markdown. Ważne jest, aby przetestować wyświetlanie odpowiedzi aplikacji klienckiej.
Zobacz pełną listę typów zawartości i przykładów.
Podstawowe formatowanie dokumentu
Usługa QnA Maker identyfikuje sekcje i podsekcje i relacje w pliku na podstawie wskazówek wizualnych, takich jak:
- rozmiar czcionki
- styl czcionki
- numerowanie
- Kolory
Uwaga
Obecnie nie obsługujemy wyodrębniania obrazów z przekazanych dokumentów.
Podręczniki produktu
Podręcznik jest zazwyczaj materiałem wskazówek, który towarzyszy produktowi. Ułatwia on użytkownikowi konfigurowanie, używanie, konserwację i rozwiązywanie problemów z produktem. Gdy usługa QnA Maker przetwarza instrukcję ręczną, wyodrębnia nagłówki i podpozycje jako pytania oraz kolejną zawartość jako odpowiedzi. Zobacz przykład tutaj.
Poniżej znajduje się przykład podręcznika ze stroną indeksu i zawartością hierarchiczną
Uwaga
Wyodrębnianie działa najlepiej w podręcznikach, które mają spis treści i/lub stronę indeksu oraz czystą strukturę z nagłówkami hierarchicznymi.
Broszury, wytyczne, dokumenty i inne pliki
Wiele innych typów dokumentów można również przetworzyć w celu wygenerowania par QA, pod warunkiem, że mają wyraźną strukturę i układ. Należą do nich: Broszury, wytyczne, raporty, oficjalne dokumenty, dokumenty naukowe, zasady, książki itp. Zobacz przykład tutaj.
Poniżej przedstawiono przykład częściowo ustrukturyzowanego dokumentu bez indeksu:
Obsługa dokumentów bez struktury
Niestandardowe odpowiadanie na pytania obsługuje teraz dokumenty bez struktury. Dokument, który nie ma zawartości zorganizowanej w dobrze zdefiniowany hierarchiczny sposób, brakuje struktury zestawu lub ma swobodny przepływ zawartości, można traktować jako dokument bez struktury.
Poniżej znajduje się przykład dokumentu PDF bez struktury:
Obecnie ta funkcja jest dostępna tylko za pośrednictwem przekazywania dokumentów i tylko w formatach plików PDF i DOC.
Ważne
Obsługa pliku/zawartości bez struktury jest dostępna tylko w odpowiedziach na pytania.
Ustrukturyzowany dokument pytań i pytań
Format ustrukturyzowanych odpowiedzi na pytania w plikach DOC jest w postaci przemiennych pytań i odpowiedzi na wiersz, jednego pytania na wiersz, po którym następuje odpowiedź w następującym wierszu, jak pokazano poniżej:
Question1
Answer1
Question2
Answer2
Poniżej znajduje się przykład ustrukturyzowanego dokumentu słowa QnA:
Pliki TXT ze strukturą, TSV i XLS
QnAs w postaci ustrukturyzowanych .txt, tsv lub .xls plików można również przekazać do usługi QnA Maker w celu utworzenia lub rozszerzenia baza wiedzy. Może to być zwykły tekst lub może zawierać zawartość w formacie RTF lub HTML. Pary pytań i odpowiedzi mają opcjonalne pole metadanych, które może służyć do grupowania par pytań i odpowiedzi na kategorie.
Pytanie | Odpowiedź | Metadane (1 klucz: 1 wartość) |
---|---|---|
Pytanie1 | Odpowiedź1 | Key1:Value1 | Key2:Value2 |
Pytanie2 | Odpowiedź2 | Key:Value |
Wszystkie dodatkowe kolumny w pliku źródłowym są ignorowane.
Przykład pliku programu Excel ze strukturą
Poniżej przedstawiono przykład ustrukturyzowanego pliku QnA .xls z zawartością HTML:
Przykład alternatywnych pytań dotyczących pojedynczej odpowiedzi w pliku programu Excel
Poniżej znajduje się przykład ustrukturyzowanego pliku .xls pytań i odpowiedzi z kilkoma alternatywnymi pytaniami:
Po zaimportowaniu pliku para pytań i odpowiedzi znajduje się w baza wiedzy, jak pokazano poniżej:
Format danych ustrukturyzowanych za pomocą importu
Importowanie baza wiedzy zastępuje zawartość istniejącego baza wiedzy. Importowanie wymaga ustrukturyzowanego pliku tsv zawierającego informacje o źródle danych. Te informacje pomagają usłudze QnA Maker grupować pary odpowiedzi na pytania i przypisywać je do określonego źródła danych. Pary pytań i odpowiedzi mają opcjonalne pole metadanych, które może służyć do grupowania par pytań i odpowiedzi na kategorie.
Pytanie | Odpowiedź | Źródło | Metadane (1 klucz: 1 wartość) |
---|---|---|---|
Pytanie1 | Odpowiedź1 | Adres URL1 | Key1:Value1 | Key2:Value2 |
Pytanie2 | Odpowiedź2 | Redakcyjne | Key:Value |
Formatowanie dokumentu z wieloma obrotami
- Użyj nagłówków i nagłówków podrzędnych, aby oznaczyć hierarchię. Możesz na przykład h1 oznaczać nadrzędną QnA i h2, aby oznaczyć QnA, które powinny być traktowane jako monit. Użyj małego rozmiaru nagłówka, aby oznaczyć kolejną hierarchię. Nie używaj stylu, koloru ani innego mechanizmu, aby sugerować strukturę w dokumencie, usługa QnA Maker nie wyodrębni monitów z wieloma zwrotami.
- Pierwszy znak nagłówka musi być wielkich liter.
- Nie należy kończyć nagłówka znakiem
?
zapytania .
Przykładowe dokumenty:
Surface Pro (dokument)
Korzyści firmy Contoso (docx)
Korzyści firmy Contoso (pdf)
Adresy URL często zadawanych pytań
Usługa QnA Maker może obsługiwać strony internetowe z często zadawanymi pytaniami w 3 różnych formularzach:
- Zwykłe strony często zadawanych pytań
- Strony z linkami — często zadawane pytania
- Strony często zadawanych pytań ze stroną główną tematów
Zwykłe strony często zadawanych pytań
Jest to najczęściej spotykana strona często zadawanych pytań, na której odpowiedzi są natychmiast zgodne z pytaniami na tej samej stronie.
Poniżej przedstawiono przykład zwykłej strony często zadawanych pytań:
Strony z linkami — często zadawane pytania
Na tej stronie często zadawanych pytań pytania są agregowane razem i są połączone z odpowiedziami, które znajdują się w różnych sekcjach tej samej strony lub na różnych stronach.
Poniżej znajduje się przykład strony często zadawanych pytań z linkami w sekcjach, które znajdują się na tej samej stronie:
Strona Tematy nadrzędne łączy się ze stronami odpowiedzi podrzędnych
Ten typ często zadawanych pytań zawiera stronę Tematy, na której każdy temat jest połączony z odpowiednim zestawem pytań i odpowiedzi na innej stronie. Usługa QnA Maker przeszukiwa wszystkie połączone strony w celu wyodrębnienia odpowiednich pytań i odpowiedzi.
Poniżej znajduje się przykład strony Tematy z linkami do sekcji Często zadawane pytania na różnych stronach.
Adresy URL pomocy technicznej
Usługa QnA Maker może przetwarzać częściowo ustrukturyzowane strony internetowe, takie jak artykuły internetowe, które opisują sposób wykonywania danego zadania, diagnozowanie i rozwiązywanie danego problemu oraz najlepsze rozwiązania dla danego procesu. Wyodrębnianie działa najlepiej w przypadku zawartości, która ma wyraźną strukturę z nagłówkami hierarchicznymi.
Uwaga
Wyodrębnianie artykułów pomocy technicznej jest nową funkcją i jest na wczesnym etapie. Najlepiej sprawdza się w przypadku prostych stron, które są dobrze ustrukturyzowane i nie zawierają złożonych nagłówków/stopek.
Importowanie i eksportowanie baza wiedzy
Pliki TSV i XLS z wyeksportowanych baza wiedzy mogą być używane tylko przez zaimportowanie plików ze strony Ustawienia w portalu usługi QnA Maker. Nie można ich używać jako źródeł danych podczas tworzenia baza wiedzy lub funkcji + Dodaj plik lub + Dodaj adres URL na stronie Ustawienia.
Podczas importowania bazy wiedzy za pomocą tych plików TSV i XLS pary pytań i odpowiedzi są dodawane do źródła redakcyjnego, a nie do źródeł, z których zostały wyodrębnione QnAs w wyeksportowanej bazie wiedzy.
Następne kroki
Zobacz pełną listę typów zawartości i przykładów