はじめに

完了

Azure AI 検索を使用すると、データをエンリッチしたりインデックスを設定するために AI スキルのパイプラインが使用される検索ソリューションを作成できます。 パイプライン内のスキルで実行されるデータ エンリッチメントにより、ソース データは次のような分析情報で補完されます。

  • ドキュメントの記述言語。
  • ドキュメントに記載されている主なテーマまたはトピックを特定するのに役立つ可能性のあるキー フレーズ。
  • ドキュメントがどれほど肯定的または否定的であるかを定量化するセンチメント スコア。
  • コンテンツ内に記載されている特定の場所、人、組織、またはランドマーク。
  • AI によって生成された画像の説明、または光学式文字認識 (OCR) によって抽出された画像テキスト。

インデックス内のエンリッチされたデータにより、ソース コンテンツの基本的なフル テキスト検索より強力な包括的検索ソリューションを作成できるようになります。

ナレッジ ストア

インデックスはインデックス作成プロセスの主な出力と見なせますが、それに含まれるエンリッチされたデータも他の方法で役立てることができます。 次に例を示します。

  • 基本的にインデックスは、それぞれがインデックス付きレコードを表す JSON オブジェクトのコレクションであるため、オブジェクトを JSON ファイルとしてエクスポートし、Azure Data Factory などのツールによるデータ オーケストレーション プロセスへの統合に使用するのに役立つ可能性があります。
  • Microsoft Power BI などのツールで分析やレポートを行うために、インデックス レコードをテーブルのリレーショナル スキーマに正規化することもできます。
  • インデックス作成プロセスでは埋め込み画像をドキュメントから抽出するので、それらの画像をファイルとして保存することもできます。

インデクサーがオブジェクト、テーブル、および画像のプロジェクションをナレッジ ストアに書き込む方法を示す図。

Azure AI 検索は、エンリッチメント パイプラインをカプセル化するスキルセットで "ナレッジ ストア" を定義できるようにすることで、このようなシナリオをサポートしています。 ナレッジ ストアは、エンリッチされたデータの "プロジェクション" で構成されています。これは、JSON オブジェクト、テーブル、画像ファイルのいずれかです。 インデクサーでパイプラインが実行されて、インデックスが作成または更新されると、プロジェクションが生成され、ナレッジ ストアに保持されます。

このモジュールでは、パンフレットやホテルのレビューの情報を使用して顧客の旅行計画を支援する Margie's Travel という架空の旅行代理店のナレッジ ストアを実装します。また、次の方法を学習します。

  • Azure AI 検索パイプラインからナレッジ ストアを作成する
  • ナレッジ ストアのプロジェクションでデータを表示する

Note

このモジュールでは、組み込みスキルを含む Azure AI 検索ソリューションを作成して使用する方法を既に理解していることを前提としています。 そうでない場合は、最初に「Azure AI 検索ソリューションを作成する」モジュールを完了してください。