独自のデータ ソースを追加する
データの追加は、Azure AI Studio、[チャット] プレイグラウンド、または API 呼び出しでデータ ソースを指定して行うことができます。 追加するデータ ソースは、モデルに送信されるプロンプトを拡張するために使用されます。 Studio でデータを設定するときに、データ ファイルのアップロード、BLOB ストレージ アカウントでのデータの使用、または既存の AI 検索インデックスへの接続を選択できます。
ストレージ アカウントに既に含まれるファイルをアップロードまたは使用している場合、独自のデータに基づく Azure OpenAI では、.md
、.txt
、.html
、.pdf
、および Microsoft Word または PowerPoint ファイルがサポートされます。 これらのファイルのいずれかにグラフィックスまたは画像が含まれている場合、応答品質は、ビジュアル コンテンツからどの程度テキストを抽出できるかによって異なります。
データをアップロードする場合、またはストレージ アカウント内のファイルに接続する場合は、Azure AI Studio を使用して検索リソースとインデックスを作成することをお勧めします。 このようにデータを追加すると、インデックスに挿入するときに適切なチャンクが行われ、より良い応答が得られます。 大きなテキスト ファイルまたはフォームを使用している場合は、使用可能なデータ準備スクリプトを使って AI モデルの精度を向上させる必要があります。
AI 検索サービスのセマンティック検索を有効にすると、データ インデックスの検索結果が向上し、より高品質な応答と引用を受け取ることができるようになります。 しかし、セマンティック検索を有効にすると、検索サービスのコストが増加する可能性があります。
AI 検索リソースでウィザードを使用してデータを適切にベクトル化することもできます。これについては、このモジュールの演習で説明します。 AI Studio で行う場合に比べて追加の手順がいくつか必要になりますが、既存のデータセットで RAG パターンを使用する良い例として役立ちます。
データの接続
データを接続するには、Azure AI Studio の [チャット] プレイグラウンドに移動し、[データの追加] タブを選択します。[データ ソースの追加] ボタンを選択して、データを接続します。 プロンプトの指示に従って、各データ ソースへの接続を設定し、そのデータを検索インデックスに取り込みます。
ヒント
AI Studio のウィザードを使用してデータ ソースを作成して接続している場合は、ハブとプロジェクトを作成する必要がありますが、ここでは説明しません。 AI Studio でその手順を確認するか、AI Studio のドキュメントを参照してください。
Azure AI Studio で作成されていない独自のインデックスを使用している場合は、いずれかのページで列マッピングを指定できます。 モデルが特に [コンテンツ データ] に対してより適切な応答を提供できるようにするには、正確なフィールドを提供することが重要です。