インデックス付け中に追加処理を行うスキル (Azure AI Search)
この記事では、外部処理にアクセスするためにスキルセットに含めることができる Azure AI 検索のスキルについて説明します。
スキルは、コンテンツを何らかの方法で変換するアトミック操作を提供します。 スキルは、多くの場合はテキストを認識または抽出する操作ですが、既に作成されているエンリッチメントを整形するユーティリティ スキルである場合もあります。 通常、出力はテキストベースであるため、フルテキスト検索や、ベクトル検索で使用されるベクトルで使用できます。
スキルは、次のカテゴリに分類されます。
"組み込みスキル" は、入力、出力、処理のステップが十分に理解されている Azure AI リソースへの API 呼び出しをラップします。 Azure AI リソースを呼び出すスキルの場合、接続は内部ネットワーク上で行われます。 Azure OpenAI を呼び出すスキルの場合、検索サービスがリソースへの接続に使用する接続情報を指定します。 少量の処理は課金対象になりませんが、大量の場合処理は課金されます。 組み込みのスキルは、Microsoft の事前トレーニング済みのモデルに基づいており、これは独自のトレーニング データを使用してモデルをトレーニングできないことを意味します。
カスタム スキルは、検索サービスの外部で実行されるカスタム コードを提供します。 URI を介してアクセスします。 カスタム コードは、多くの場合 Azure 関数アプリを通じて使用できます。 オープンソースまたはサードパーティーのベクトル化モデルをアタッチするには、カスタム スキルを使用します。
ユーティリティは Azure AI Search の内部にあり、外部リソースや送信接続に依存しません。 ほとんどのユーティリティは課金対象外です。
Azure AI リソースのスキル
Azure AI を呼び出すスキルは、AI サービス リソースをアタッチすると、従量課金制のレートで課金されます。
OData 型 | 説明 | 課金元 |
---|---|---|
Microsoft.Skills.Text.CustomEntityLookupSkill | ユーザーが定義したカスタムの単語と語句のリストからテキストを検索します。 | Azure AI Search (価格) |
Microsoft.Skills.Text.KeyPhraseExtractionSkill | このスキルでは、トレーニング済みモデルを使用し、語句の配置、言語規則、他の語句との近さ、ソース データ内での語句の不自然さの程度に基づいて、重要な語句を検出します。 | Azure AI サービス (価格) |
Microsoft.Skills.Text.LanguageDetectionSkill | このスキルでは、トレーニング済みモデルを使用し、使用されている言語を検出します (ドキュメントごとに 1 つの言語 ID)。 同じテキスト セグメント内で複数の言語が使用されている場合、出力は、主に使用されている言語の LCID になります。 | Azure AI サービス (価格) |
Microsoft.Skills.Text.V3.EntityLinkingSkill | このスキルでは、事前トレーニング済みのモデルを使用し、認識されたエンティティに対して Wikipedia の記事へのリンクを生成します。 | Azure AI サービス (価格) |
Microsoft.Skills.Text.V3.EntityRecognitionSkill | このスキルでは、トレーニング済みモデルを使用し、"Person" 、"Location" 、"Organization" 、"Quantity" 、"DateTime" 、"URL" 、"Email" 、"PersonType" 、"Event" 、"Product" 、"Skill" 、"Address" 、"Phone Number" および "IP Address" の各フィールドのカテゴリの固定したセットに対してエンティティを確立します。 |
Azure AI サービス (価格) |
Microsoft.Skills.Text.PIIDetectionSkill | このスキルは、事前トレーニングされたモデルを使用して、特定のテキストから個人情報を抽出します。 また、このスキルには、テキスト内で検出された個人情報エンティティをマスクするためのさまざまなオプションも用意されています。 | Azure AI サービス (価格) |
Microsoft.Skills.Text.V3.SentimentSkill | このスキルでは、トレーニング済みのモデルを使用し、レコードごとに文章とドキュメントレベルでサービスによって検出された最も高い信頼度スコアに基づいて、センチメント ラベル ("ネガティブ"、"中立"、"ポジティブ" など) を割り当てます。 | Azure AI サービス (価格) |
Microsoft.Skills.Text.TranslationSkill | このスキルは、正規化やローカライズのユース ケースにおいて、事前トレーニング済みのモデルを使用して入力テキストをさまざまな言語に翻訳します。 | Azure AI サービス (価格) |
Microsoft.Skills.Vision.ImageAnalysisSkill | このスキルでは、画像検出アルゴリズムを使用して画像の内容を識別し、テキストの説明を生成します。 | Azure AI サービス (価格) |
Microsoft.Skills.Vision.OcrSkill | 光学式文字認識。 | Azure AI サービス (価格) |
Microsoft.Skills.Vision.VectorizeSkill | マルチモーダル イメージとテキストのベクター化。 | Azure AI サービス (価格) |
Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill | ドキュメントからの情報抽出を高速化します。 | Azure AI サービス (価格) |
Azure OpenAI のスキル
Azure OpenAI にデプロイされたモデルを呼び出すスキルは、従量課金制のレートで課金されます。
OData 型 | 説明 | 課金元 |
---|---|---|
Microsoft.Skills.Text.AzureOpenAIEmbeddingSkill | 垂直統合のために Azure OpenAI 上のデプロイされた埋め込みモデルに接続します。 | Azure OpenAI (価格) |
ユーティリティ スキル
Azure AI Search でのみ実行され、主にエンリッチメント キャッシュ内のノードで反復処理を行い、ほとんどが課金対象ではないスキル。
OData 型 | 説明 | 課金元 |
---|---|---|
Microsoft.Skills.Util.ConditionalSkill | 条件に基づくフィルター処理、既定値の割り当て、データのマージを行うことができます。 | 適用なし |
Microsoft.Skills.Util.DocumentExtractionSkill | エンリッチメント パイプライン内のファイルからコンテンツを抽出します。 | 画像抽出用の Azure AI Search (価格)。 |
Microsoft.Skills.Text.MergeSkill | フィールドのコレクションからのテキストを 1 つのフィールドに統合します。 | 適用なし |
Microsoft.Skills.Util.ShaperSkill | 出力を複合型 (フル ネーム、複数行の住所、または姓と個人識別子の組み合わせに使用される可能性があるマルチパート データ型) にマップします。 | 適用なし |
Microsoft.Skills.Text.SplitSkill | コンテンツを徐々に強化または拡張できるように、テキストをページに分割します。 | 適用なし |
カスタム スキル
カスタム スキルは、設計、開発、および Web へのデプロイを行う外部コードをラップします。 その後、スキルセット内からカスタム スキルとしてモジュールを呼び出すことができます。
型 | 説明 | 課金元 |
---|---|---|
Microsoft.Skills.Custom.WebApiSkill | カスタム Web API に対して HTTP 呼び出しを行うことで、AI エンリッチメント パイプラインを拡張することができます | ソリューションで従量制課金の Azure サービスを使用していない場合は、なし |
Microsoft.Skills.Custom.AmlSkill | Azure Machine Learning モデルで AI エンリッチメント パイプラインを拡張できるようにします | ソリューションで従量制課金の Azure サービスを使用していない場合は、なし |
カスタム スキルの作成ガイダンスについては、カスタム インターフェイスの定義と AI エンリッチメント用のカスタム スキルを作成する方法に関する記事を参照してください。