QnA Maker ナレッジ ベースのベスト プラクティス
ナレッジ ベース開発ライフサイクルでは、ナレッジ ベースを始まりから終わりまで管理する方法を紹介しています。 以下のベスト プラクティスを利用してナレッジ ベースを改善し、対象のアプリケーションまたはチャット ボットのエンド ユーザーにより良い情報を提供します。
Note
QnA Maker サービスは、2025 年 3 月 31 日に廃止される予定です。 Azure AI Language の一部として、質問応答機能の新しいバージョンが提供されました。 言語サービス内の質問応答機能については、質問応答に関する記事を参照してください。 QnA Maker の新しいリソースは、2022 年 10 月 1 日以降作成できません。 既存の QnA Maker のナレッジ ベースを質問応答に移行する方法については、移行ガイドを参照してください。
抽出
QnA Maker サービスは継続的に、コンテンツから QnA を抽出するアルゴリズムを改善し、サポートされるファイルおよび HTML 形式のリストを拡大しています。 ドキュメントの種類に応じた、データ抽出のガイドラインに従ってください。
一般的に、FAQ ページは独立させ、他の情報と組み合わせないでください。 製品マニュアルにはわかりやすい見出しを付けてください。索引ページを付けることもお勧めします。
複数ターンの構成
複数ターン抽出を有効にしてナレッジ ベースを作成します。 ナレッジ ベースで質問階層をサポートしている場合や質問階層をサポートする必要がある場合は、この階層を、ドキュメントから抽出するか、ドキュメントの抽出後に作成することができます。
優れた質問と回答の作成
優れた質問
最高の質問は単純です。 各質問のキーワードまたはキー フレーズを検討した後、そのキーワードまたはキー フレーズに関する単純な質問を作成します。
同じような意味の質問を必要な数だけ追加しますが、変更は単純にしておきます。 質問の主な目標の一部ではないワードまたはフレーズを追加しても、QnA Maker で一致するものを検索するための助けにはなりません。
関連する他の質問を追加する
ユーザーは、How do I add a toner cartridge to my printer?
のような会話形式のテキストか、toner cartridge
のようなキーワード検索のどちらかで質問を入力する可能性があります。 最善の回答を正しく返すためには、ナレッジ ベースにこの両方のスタイルの質問が用意されている必要があります。 顧客がどのキーワードを入力しているのかわからない場合は、Application Insights のデータを使用してクエリを分析します。
優れた回答
最善の回答はシンプルな回答ですが、シンプルすぎてはいけません。 yes
や no
などの回答は使用してはいけません。 回答を他のソースにリンクしたり、メディアとリンクを使用してリッチ エクスペリエンスを提供したりする必要がある場合は、メタデータ タグ付けを使用して回答を識別した後、strictFilters
プロパティにそのメタデータ タグを含むクエリを送信して、正しい回答のバージョンを取得します。
回答 | フォローアップ プロンプト |
---|---|
キーボードの電源ボタンを押して Surface ノート PC の電源を切ってください。 | * スリープ、シャットダウン、再起動を行うキーの組み合わせ。 * Surface ノート PC 本体を起動する方法 * Surface ノート PC の BIOS を変更する方法 * スリープ、シャットダウン、再起動の違い |
カスタマー サービスは、電話、Skype、テキスト メッセージで 24 時間ご利用いただけます。 | * 販売に関する連絡先情報。 * 直接訪問できるオフィスと店舗の場所と営業時間。 * Surface ノート PC のアクセサリ。 |
おしゃべり
少ない労力でボットをより話し上手で魅力的にするために、おしゃべりをボットに追加します。 ナレッジ ベースの作成時に、事前定義済みの性格に対応したおしゃべりデータ セットを簡単に追加し、いつでも性格を変更することができます。 おしゃべりをナレッジ ベースに追加する方法を学びます。
おしゃべりは多くの言語でサポートされています。
性格の選択
おしゃべりでは、次のいくつかの事前定義済みの性格がサポートされています。
パーソナリティ | QnA Maker データセット ファイル |
---|---|
2 次元形式 | qna_chitchat_professional.tsv |
Friendly | qna_chitchat_friendly.tsv |
Witty | qna_chitchat_witty.tsv |
Caring (温かい) | qna_chitchat_caring.tsv |
Enthusiastic (熱心) | qna_chitchat_enthusiastic.tsv |
改まった応答からくだけた応答、非礼な応答まで可能です。 ボットに演じさせたい雰囲気に最も近い性格を選びます。 データセットを表示し、ボットの基本として機能するデータセットを選択した後、応答をカスタマイズすることができます。
ボット固有の質問の編集
おしゃべりデータ セットの一部であり、一般的な回答が入力されているボット固有の質問がいくつかあります。 ボットの詳細を最も的確に反映するように、これらの回答を変更します。
以下のおしゃべり QnA をより具体的にすることをお勧めします。
- ユーザーはだれか
- 何を実行できるか
- 何歳ですか?
- あなたを創造したのは誰ですか?
- こんにちは
メタデータ タグを使用したカスタムのおしゃべりの追加
独自のおしゃべり QnA ペアを追加する場合は、必ずメタデータを追加して、これらの回答が返されるようにします。 メタデータの名前と値のペアは editorial:chitchat
です。
回答の検索
GenerateAnswer API では、質問と回答の両方を使用して、ユーザーのクエリに対する最善の回答を検索します。
回答が適切でない場合にのみ質問を検索する
回答を検索しない場合は、RankerType=QuestionOnly
を使用します。
この例としては、ナレッジ ベースが、質問としての頭字語と完全形としての回答を含むカタログである場合があります。 回答の値は、適切な回答を検索するのに役立ちません。
ランキング/スコア
QnA Maker でサポートされている優先度付け機能を効果的に活用してください。 それにより、ユーザーからの問い合わせに適切な回答が与えられる可能性が上がります。
しきい値の選択
しきい値として使用される既定の信頼度スコアは 0 ですが、ニーズに基づいてナレッジ ベースのしきい値を変更できます。 すべてのナレッジ ベースは異なっているため、ナレッジ ベースに最も適したしきい値をテストして選択する必要があります。
ランカーの種類の選択
既定では、QnA Maker は質問と回答を検索します。 質問のみを検索して、回答を生成する場合、GenerateAnswer 要求の POST 本文で RankerType=QuestionOnly
を使用します。
代わりの質問を追加する
代わりの質問を用意すること (別の表現で言い換えること) で、ユーザーからの問い合わせに一致する可能性が向上します。 代わりの質問は、同じ質問にさまざまな表現が使われるときに役立ちます。 これには、文の構造や言葉遣いの変化が含まれることがあります。
元の質問 | 代わりの質問 | Change |
---|---|---|
駐車場は空いていますか? | 駐車場はありますか? | 文の構造 |
やあ | よう おい! |
言葉遣いまたはスラング |
メタデータ タグを使用して質問と回答をフィルター処理する
メタデータは、クライアント アプリケーションがすべての回答を取得する代わりにメタデータ タグに基づいてユーザー クエリの結果を絞り込む必要があることを認識する機能を追加します。 ナレッジ ベースの回答は、問い合わせが同じであっても、メタデータ タグに基づいて異なる場合があります。 たとえば、"where is parking located" (駐車場はどこですか) という問いに対し、レストランの支店の場所が違えば、つまり、Location: Seattle (所在地: シアトル) のときと、Location: Redmond (所在地: レドモンド) のときで答えが変わります。
同義語を使用する
英語では同意語をある程度サポートしていますが、さまざま言い方があるキーワードに同意語を追加するには、Alterations API を介して、大文字と小文字が区別されない言葉の変更機能を使用します。 同義語は QnA Maker サービスレベルで追加され、サービス内の全ナレッジ ベースで共有されます。
質問を区別する目的で明確な言葉を使う
QnA Maker のランク付けアルゴリズムはユーザーからの問い合わせとナレッジ ベースに登録されている質問を一致させるアルゴリズムですが、このアルゴリズムはそれぞれの質問が異なるニーズに対処する場合に最も効果を発揮します。 複数の質問で同じ言葉が繰り返し使われていると、その言葉が含まれる問い合わせが届いたとき、正しい回答が選ばれる可能性が下がります。
たとえば、2 つの個別 QnA があり、次のような質問内容であるとします。
QnA |
---|
駐車場所はどこですか |
ATM の "場所" はどこですか |
これら 2 つの QnA は非常によく似た語で表現されていますが、この類似性のために、「<x>
の場所はどこですか」のように表現されるユーザーの問い合わせの多くが非常に近いスコアになる可能性があります。 代わりに、ナレッジ ベース内の多くの質問に存在するかもしれない「場所」のような語を避け、「駐車場はどこですか」や「ATM はどこですか」のような質問で違いを明確にしてください。
協力
QnA Maker では、ユーザーはナレッジ ベースに協力できます。 ナレッジ ベースにアクセスするには、ユーザーに Azure AI QnA Maker リソース グループへのアクセス権が必要です。 ナレッジ ベースの編集と保守管理を外注する組織もありますが、その場合でも Azure リソースへのアクセスを保護できます。 この編集者/承認者モデルは、異なるサブスクリプションで同じ QnA Maker サービスを 2 つ設定し、その 1 つを編集/テスト サイクルに選択することで実現されます。 テストが終了したら、インポート/エクスポート プロセスを利用して、承認者の QnA Maker サービスにナレッジ ベース コンテンツを転送します。この承認者が最終的にナレッジ ベースを公開し、エンドポイントを更新します。
アクティブ ラーニング
アクティブ ラーニングは、幅広い質と量のユーザー ベースのクエリがある場合に、代替の質問を提案するという最高の仕事をします。 クライアント アプリケーションのユーザー クエリが、検閲なしのアクティブ ラーニングのフィードバック ループに参加できるようにすることが重要です。 QnA Maker ポータルで質問が提案されたら、提案によるフィルター処理を行い、それらの提案をレビューして、承認または拒否する必要があります。