言語モデルのグラウンディング方法を理解する

完了

言語モデルは魅力的なテキストの生成に優れ、Copilot のベースとして最適です。 Copilot は、作業のサポートを受けるための直感的なチャット ベースのアプリケーションをユーザーに提供します。 特定のユース ケース用に Copilot を設計する場合は、お使いの言語モデルがグラウンディングされ、ユーザーが必要とする内容に関連する事実情報を使用することを確実にする必要があります。

言語モデルは膨大な量のデータでトレーニングされますが、ユーザーが利用できるようにしたい知識にアクセスできない可能性があります。 ドメイン固有の正確な応答を提供するために、Copilot が特定のデータでグラウンディングされていることを確実にするため、検索拡張生成 (RAG) を使用できます。

RAG について理解する

RAG は、言語モデルのグラウンディングに使用できる手法です。 言い換えると、それはユーザーの最初のプロンプトに関連する情報を取得するためのプロセスです。 一般に、RAG パターンには次の手順が組み込まれています。

取得拡張生成パターンのダイアグラム。

  1. ユーザーが入力した最初のプロンプトに基づいて、グラウンディング データを取得します。
  2. グラウンディング データを使用してプロンプトを拡張します。
  3. 言語モデルを使用して、根拠のある応答を生成します。

指定されたデータ ソースからコンテキストを取得することで、言語モデルがトレーニング データに依存するのではなく、応答時の関連情報を使用するようにします。

RAG の使用は、言語モデルをグラウンディングし、Copilot の応答の事実の正確性を向上させる必要がある多くのケースに、強力で使いやすい手法です。

Azure AI プロジェクトへのグラウンディング データの追加

Azure AI Studio を使用し、独自のデータを使用して、プロンプトをグラウンディングするカスタム コパイロットを構築することができます。 Azure AI Studio では、次のようなデータをプロジェクトに追加するために使用できる、さまざまなデータ接続がサポートされています。

  • Azure Blob Storage
  • Azure Data Lake Storage Gen2
  • Microsoft OneLake

AI Studio プロジェクトで使用するストレージに、ファイルまたはフォルダーをアップロードすることもできます。

Azure AI Studio 内の [データの追加] ダイアログのスクリーンショット。