Udostępnij za pośrednictwem


Wytyczne dotyczące formatowania importowanych dokumentów i adresów URL

Zapoznaj się z tymi wytycznymi dotyczącymi formatowania, aby uzyskać najlepsze wyniki dla zawartości.

Zagadnienia dotyczące formatowania

Po zaimportowaniu pliku lub adresu URL usługa QnA Maker konwertuje i przechowuje zawartość w formacie markdown. Proces konwersji dodaje nowe wiersze w tekście, takie jak \n\n. Znajomość formatu markdown pomaga zrozumieć przekonwertowaną zawartość i zarządzać zawartością baza wiedzy.

Jeśli dodasz lub edytujesz zawartość bezpośrednio w baza wiedzy, użyj formatowania markdown, aby utworzyć zawartość tekstu sformatowanego lub zmienić zawartość formatu markdown, która jest już w odpowiedzi. Usługa QnA Maker obsługuje znaczną część formatu języka znaczników Markdown, aby zapewnić możliwości tekstu sformatowanego do zawartości. Jednak aplikacja kliencka, taka jak czatbot, może nie obsługiwać tego samego zestawu formatów markdown. Ważne jest, aby przetestować wyświetlanie odpowiedzi aplikacji klienckiej.

Zobacz pełną listę typów zawartości i przykładów.

Podstawowe formatowanie dokumentu

Usługa QnA Maker identyfikuje sekcje i podsekcje i relacje w pliku na podstawie wskazówek wizualnych, takich jak:

  • rozmiar czcionki
  • styl czcionki
  • numerowanie
  • Kolory

Uwaga

Obecnie nie obsługujemy wyodrębniania obrazów z przekazanych dokumentów.

Podręczniki produktu

Podręcznik jest zazwyczaj materiałem wskazówek, który towarzyszy produktowi. Ułatwia on użytkownikowi konfigurowanie, używanie, konserwację i rozwiązywanie problemów z produktem. Gdy usługa QnA Maker przetwarza instrukcję ręczną, wyodrębnia nagłówki i podpozycje jako pytania oraz kolejną zawartość jako odpowiedzi. Zobacz przykład tutaj.

Poniżej znajduje się przykład podręcznika ze stroną indeksu i zawartością hierarchiczną

Przykład podręcznika produktu dla baza wiedzy

Uwaga

Wyodrębnianie działa najlepiej w podręcznikach, które mają spis treści i/lub stronę indeksu oraz czystą strukturę z nagłówkami hierarchicznymi.

Broszury, wytyczne, dokumenty i inne pliki

Wiele innych typów dokumentów można również przetworzyć w celu wygenerowania par QA, pod warunkiem, że mają wyraźną strukturę i układ. Należą do nich: Broszury, wytyczne, raporty, oficjalne dokumenty, dokumenty naukowe, zasady, książki itp. Zobacz przykład tutaj.

Poniżej przedstawiono przykład częściowo ustrukturyzowanego dokumentu bez indeksu:

Dokumentacja częściowo ustrukturyzowana w usłudze Azure Blob Storage

Obsługa dokumentów bez struktury

Niestandardowe odpowiadanie na pytania obsługuje teraz dokumenty bez struktury. Dokument, który nie ma zawartości zorganizowanej w dobrze zdefiniowany hierarchiczny sposób, brakuje struktury zestawu lub ma swobodny przepływ zawartości, można traktować jako dokument bez struktury.

Poniżej znajduje się przykład dokumentu PDF bez struktury:

Przykład dokumentu bez struktury dla baza wiedzy

Obecnie ta funkcja jest dostępna tylko za pośrednictwem przekazywania dokumentów i tylko w formatach plików PDF i DOC.

Ważne

Obsługa pliku/zawartości bez struktury jest dostępna tylko w odpowiedziach na pytania.

Ustrukturyzowany dokument pytań i pytań

Format ustrukturyzowanych odpowiedzi na pytania w plikach DOC jest w postaci przemiennych pytań i odpowiedzi na wiersz, jednego pytania na wiersz, po którym następuje odpowiedź w następującym wierszu, jak pokazano poniżej:

Question1

Answer1

Question2

Answer2

Poniżej znajduje się przykład ustrukturyzowanego dokumentu słowa QnA:

Przykład ustrukturyzowanego dokumentu QnA dla baza wiedzy

Pliki TXT ze strukturą, TSV i XLS

QnAs w postaci ustrukturyzowanych .txt, tsv lub .xls plików można również przekazać do usługi QnA Maker w celu utworzenia lub rozszerzenia baza wiedzy. Może to być zwykły tekst lub może zawierać zawartość w formacie RTF lub HTML. Pary pytań i odpowiedzi mają opcjonalne pole metadanych, które może służyć do grupowania par pytań i odpowiedzi na kategorie.

Pytanie Odpowiedź Metadane (1 klucz: 1 wartość)
Pytanie1 Odpowiedź1 Key1:Value1 | Key2:Value2
Pytanie2 Odpowiedź2 Key:Value

Wszystkie dodatkowe kolumny w pliku źródłowym są ignorowane.

Przykład pliku programu Excel ze strukturą

Poniżej przedstawiono przykład ustrukturyzowanego pliku QnA .xls z zawartością HTML:

Przykład ustrukturyzowanego programu Excel dla baza wiedzy

Przykład alternatywnych pytań dotyczących pojedynczej odpowiedzi w pliku programu Excel

Poniżej znajduje się przykład ustrukturyzowanego pliku .xls pytań i odpowiedzi z kilkoma alternatywnymi pytaniami:

Przykład alternatywnych pytań dotyczących pojedynczej odpowiedzi w pliku programu Excel

Po zaimportowaniu pliku para pytań i odpowiedzi znajduje się w baza wiedzy, jak pokazano poniżej:

Zrzut ekranu przedstawiający alternatywne pytania dotyczące pojedynczej odpowiedzi zaimportowanej do baza wiedzy

Format danych ustrukturyzowanych za pomocą importu

Importowanie baza wiedzy zastępuje zawartość istniejącego baza wiedzy. Importowanie wymaga ustrukturyzowanego pliku tsv zawierającego informacje o źródle danych. Te informacje pomagają usłudze QnA Maker grupować pary odpowiedzi na pytania i przypisywać je do określonego źródła danych. Pary pytań i odpowiedzi mają opcjonalne pole metadanych, które może służyć do grupowania par pytań i odpowiedzi na kategorie.

Pytanie Odpowiedź Źródło Metadane (1 klucz: 1 wartość)
Pytanie1 Odpowiedź1 Adres URL1 Key1:Value1 | Key2:Value2
Pytanie2 Odpowiedź2 Redakcyjne Key:Value

Formatowanie dokumentu z wieloma obrotami

  • Użyj nagłówków i nagłówków podrzędnych, aby oznaczyć hierarchię. Możesz na przykład h1 oznaczać nadrzędną QnA i h2, aby oznaczyć QnA, które powinny być traktowane jako monit. Użyj małego rozmiaru nagłówka, aby oznaczyć kolejną hierarchię. Nie używaj stylu, koloru ani innego mechanizmu, aby sugerować strukturę w dokumencie, usługa QnA Maker nie wyodrębni monitów z wieloma zwrotami.
  • Pierwszy znak nagłówka musi być wielkich liter.
  • Nie należy kończyć nagłówka znakiem ?zapytania .

Przykładowe dokumenty:
Surface Pro (dokument)
Korzyści firmy Contoso (docx)
Korzyści firmy Contoso (pdf)

Adresy URL często zadawanych pytań

Usługa QnA Maker może obsługiwać strony internetowe z często zadawanymi pytaniami w 3 różnych formularzach:

  • Zwykłe strony często zadawanych pytań
  • Strony z linkami — często zadawane pytania
  • Strony często zadawanych pytań ze stroną główną tematów

Zwykłe strony często zadawanych pytań

Jest to najczęściej spotykana strona często zadawanych pytań, na której odpowiedzi są natychmiast zgodne z pytaniami na tej samej stronie.

Poniżej przedstawiono przykład zwykłej strony często zadawanych pytań:

Przykład strony zwykłych często zadawanych pytań dla baza wiedzy

Na tej stronie często zadawanych pytań pytania są agregowane razem i są połączone z odpowiedziami, które znajdują się w różnych sekcjach tej samej strony lub na różnych stronach.

Poniżej znajduje się przykład strony często zadawanych pytań z linkami w sekcjach, które znajdują się na tej samej stronie:

Przykład strony linku sekcji — często zadawane pytania dotyczące baza wiedzy

Ten typ często zadawanych pytań zawiera stronę Tematy, na której każdy temat jest połączony z odpowiednim zestawem pytań i odpowiedzi na innej stronie. Usługa QnA Maker przeszukiwa wszystkie połączone strony w celu wyodrębnienia odpowiednich pytań i odpowiedzi.

Poniżej znajduje się przykład strony Tematy z linkami do sekcji Często zadawane pytania na różnych stronach.

Przykład strony często zadawanych pytań dotyczących linku bezpośredniego dla baza wiedzy

Adresy URL pomocy technicznej

Usługa QnA Maker może przetwarzać częściowo ustrukturyzowane strony internetowe, takie jak artykuły internetowe, które opisują sposób wykonywania danego zadania, diagnozowanie i rozwiązywanie danego problemu oraz najlepsze rozwiązania dla danego procesu. Wyodrębnianie działa najlepiej w przypadku zawartości, która ma wyraźną strukturę z nagłówkami hierarchicznymi.

Uwaga

Wyodrębnianie artykułów pomocy technicznej jest nową funkcją i jest na wczesnym etapie. Najlepiej sprawdza się w przypadku prostych stron, które są dobrze ustrukturyzowane i nie zawierają złożonych nagłówków/stopek.

Usługa QnA Maker obsługuje wyodrębnianie z częściowo ustrukturyzowanych stron internetowych, w których wyświetlana jest jasna struktura z nagłówkami hierarchicznymi

Importowanie i eksportowanie baza wiedzy

Pliki TSV i XLS z wyeksportowanych baza wiedzy mogą być używane tylko przez zaimportowanie plików ze strony Ustawienia w portalu usługi QnA Maker. Nie można ich używać jako źródeł danych podczas tworzenia baza wiedzy lub funkcji + Dodaj plik lub + Dodaj adres URL na stronie Ustawienia.

Podczas importowania bazy wiedzy za pomocą tych plików TSV i XLS pary pytań i odpowiedzi są dodawane do źródła redakcyjnego, a nie do źródeł, z których zostały wyodrębnione QnAs w wyeksportowanej bazie wiedzy.

Następne kroki

Zobacz pełną listę typów zawartości i przykładów