Indexers - Get

リファレンス

サービス:: Search Service

API バージョン:: 2024-11-01-preview

インデクサー定義を取得します。

GET {endpoint}/indexers('{indexerName}')?api-version=2024-11-01-preview

URI パラメーター

名前	/	必須	型	説明
endpoint	path	True	string	検索サービスのエンドポイント URL。
indexerName	path	True	string	取得するインデクサーの名前。
api-version	query	True	string	クライアント API のバージョン。

要求ヘッダー

名前	必須	型	説明
x-ms-client-request-id		string uuid	デバッグに役立つ要求と共に送信される追跡 ID。

応答

名前	型	説明
200 OK	SearchIndexer
Other Status Codes	ErrorResponse	エラー応答。

例

SearchServiceGetIndexer

要求のサンプル

HTTP

GET https://previewexampleservice.search.windows.net/indexers('myindexer')?api-version=2024-11-01-preview

応答のサンプル

状態コード:: 200

{
  "@odata.etag": "0x1234568AE7E58A1",
  "name": "myindexer",
  "description": "Description of the indexer",
  "dataSourceName": "mydocdbdatasource",
  "skillsetName": "myskillset",
  "targetIndexName": "preview-test",
  "disabled": false,
  "schedule": {
    "interval": "P1D",
    "startTime": "2024-06-06T00:01:50.265Z"
  },
  "parameters": {
    "maxFailedItems": 10,
    "maxFailedItemsPerBatch": 5,
    "configuration": {}
  },
  "fieldMappings": [],
  "outputFieldMappings": [],
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": {
      "applicationId": "00000000-0000-0000-0000-000000000000",
      "applicationSecret": "<applicationSecret>"
    }
  }
}

定義

名前	説明
AzureActiveDirectoryApplicationCredentials	Azure Key Vault に格納されている暗号化キーへの認証済みアクセスに使用される、検索サービス用に作成された登録済みアプリケーションの資格情報。
BlobIndexerDataToExtract	Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、イメージコンテンツから抽出するデータをインデクサーに指示します。これは、.PDFまたはその他のアプリケーションの埋め込みイメージコンテンツ、または Azure BLOB の .jpg や .pngなどのイメージファイルに適用されます。
BlobIndexerImageAction	Azure BLOB ストレージ内の埋め込みイメージとイメージファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。
BlobIndexerParsingMode	Azure BLOB データソースからのインデックス作成の解析モードを表します。
BlobIndexerPDFTextRotationAlgorithm	Azure BLOB ストレージ内の PDF ファイルからテキストを抽出するためのアルゴリズムを決定します。
ErrorAdditionalInfo	リソース管理エラーの追加情報。
ErrorDetail	エラーの詳細。
ErrorResponse	エラー応答
FieldMapping	データソース内のフィールドとインデックス内のターゲットフィールドの間のマッピングを定義します。
FieldMappingFunction	インデックス作成の前にデータソースから値を変換する関数を表します。
IndexerExecutionEnvironment	インデクサーを実行する環境を指定します。
IndexingParameters	インデクサー実行のパラメーターを表します。
IndexingParametersConfiguration	インデクサー固有の構成プロパティのディクショナリ。各名前は、特定のプロパティの名前です。各値はプリミティブ型である必要があります。
IndexingSchedule	インデクサー実行のスケジュールを表します。
MarkdownHeaderDepth	マークダウンコンテンツのグループ化中に考慮されるヘッダーの最大深度を指定します。既定値は `h6`です。
MarkdownParsingSubmode	マークダウンファイルを 1 つの検索ドキュメントと複数の検索ドキュメントのどちらに解析するかを決定するサブモードを指定します。既定値は `oneToMany`です。
SearchIndexer	インデクサーを表します。
SearchIndexerCache
SearchIndexerDataNoneIdentity	データソースの ID プロパティをクリアします。
SearchIndexerDataUserAssignedIdentity	使用するデータソースの ID を指定します。
SearchResourceEncryptionKey	Azure Key Vault のカスタマーマネージド暗号化キー。作成および管理するキーは、インデックスやシノニムマップなどの保存データの暗号化または暗号化解除に使用できます。

AzureActiveDirectoryApplicationCredentials

Azure Key Vault に格納されている暗号化キーへの認証済みアクセスに使用される、検索サービス用に作成された登録済みアプリケーションの資格情報。

名前	型	説明
applicationId	string	保存データの暗号化時に使用される Azure Key Vault に対する必要なアクセス許可が付与された AAD アプリケーション ID。アプリケーション ID は、AAD アプリケーションのオブジェクト ID と混同しないでください。
applicationSecret	string	指定した AAD アプリケーションの認証キー。

BlobIndexerDataToExtract

Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、イメージコンテンツから抽出するデータをインデクサーに指示します。これは、.PDFまたはその他のアプリケーションの埋め込みイメージコンテンツ、または Azure BLOB の .jpg や .pngなどのイメージファイルに適用されます。

名前	型	説明
allMetadata	string	Azure BLOB ストレージサブシステムによって提供されるメタデータとコンテンツタイプ固有のメタデータ (たとえば、.png ファイルのみに固有のメタデータがインデックス付けされる) を抽出します。
contentAndMetadata	string	各 BLOB からすべてのメタデータとテキストコンテンツを抽出します。
storageMetadata	string	標準の BLOB プロパティとユーザー指定のメタデータのみにインデックスを作成します。

BlobIndexerImageAction

Azure BLOB ストレージ内の埋め込みイメージとイメージファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。

名前	型	説明
generateNormalizedImagePerPage	string	画像からテキスト (たとえば、トラフィック停止記号から "STOP" という単語) を抽出し、コンテンツフィールドに埋め込みますが、埋め込み画像を抽出するのではなく、各ページが画像としてレンダリングされ、それに応じて正規化されるという点で、PDF ファイルを異なる方法で処理します。 PDF 以外のファイルの種類は、"generateNormalizedImages" が設定された場合と同じように扱われます。
generateNormalizedImages	string	画像からテキスト (たとえば、トラフィック停止記号から "STOP" という単語) を抽出し、コンテンツフィールドに埋め込みます。このアクションでは、"dataToExtract" が "contentAndMetadata" に設定されている必要があります。正規化された画像とは、画像を視覚的な検索結果に含めるときに、一貫したレンダリングを促進するためにサイズを変更し、回転して均一な画像出力を生成する追加処理を指します。この情報は、このオプションを使用すると各イメージに対して生成されます。
none	string	データセット内の埋め込みイメージまたはイメージファイルを無視します。これが既定値です。

BlobIndexerParsingMode

Azure BLOB データソースからのインデックス作成の解析モードを表します。

名前	型	説明
default	string	通常のファイル処理では既定値に設定されます。
delimitedText	string	BLOB がプレーン CSV ファイルの場合は、delimitedText に設定します。
json	string	JSON ファイルから構造化コンテンツを抽出するには、json に設定します。
jsonArray	string	JSON 配列の個々の要素を個別のドキュメントとして抽出するには、jsonArray に設定します。
jsonLines	string	jsonLines に設定すると、個別のドキュメントとして、新しい行で区切られた個々の JSON エンティティが抽出されます。
markdown	string	マークダウンファイルからコンテンツを抽出するには、markdown に設定します。
text	string	BLOB ストレージ内のプレーンテキストファイルのインデックス作成のパフォーマンスを向上させるために、テキストに設定します。

BlobIndexerPDFTextRotationAlgorithm

Azure BLOB ストレージ内の PDF ファイルからテキストを抽出するためのアルゴリズムを決定します。

名前	型	説明
detectAngles	string	PDF ファイル内のテキストを回転させた PDF ファイルから、より読みやすく、読みやすいテキスト抽出が生成される場合があります。このパラメーターを使用すると、パフォーマンス速度への影響が小さくなる可能性があることに注意してください。このパラメーターは PDF ファイルにのみ適用され、テキストが埋め込まれた PDF にのみ適用されます。回転したテキストが PDF の埋め込み画像内に表示される場合、このパラメーターは適用されません。
none	string	通常のテキスト抽出を利用します。これが既定値です。

ErrorAdditionalInfo

リソース管理エラーの追加情報。

名前	型	説明
info	object	追加情報。
type	string	追加情報の種類。

ErrorDetail

エラーの詳細。

名前	型	説明
additionalInfo	ErrorAdditionalInfo[]	エラーの追加情報。
code	string	エラーコード。
details	ErrorDetail[]	エラーの詳細。
message	string	エラーメッセージ。
target	string	エラーターゲット。

ErrorResponse

エラー応答

名前	型	説明
error	ErrorDetail	エラーオブジェクト。

FieldMapping

データソース内のフィールドとインデックス内のターゲットフィールドの間のマッピングを定義します。

名前	型	説明
mappingFunction	FieldMappingFunction	インデックスを作成する前に各ソースフィールド値に適用する関数。
sourceFieldName	string	データソース内のフィールドの名前。
targetFieldName	string	インデックス内のターゲットフィールドの名前。既定では、ソースフィールド名と同じです。

FieldMappingFunction

インデックス作成の前にデータソースから値を変換する関数を表します。

名前	型	説明
name	string	フィールドマッピング関数の名前。
parameters	object	関数に渡すパラメーター名と値のペアのディクショナリ。各値はプリミティブ型である必要があります。

IndexerExecutionEnvironment

インデクサーを実行する環境を指定します。

名前	型	説明
private	string	検索サービス専用にプロビジョニングされた環境でインデクサーを実行する必要があることを示します。これは、インデクサーが共有プライベートリンクリソース経由でリソースに安全にアクセスする必要がある場合にのみ、実行環境として指定する必要があります。
standard	string	検索サービスがインデクサーを実行する場所を決定できることを示します。これは、何も指定されていない場合の既定の環境であり、推奨される値です。

IndexingParameters

インデクサー実行のパラメーターを表します。

名前	型	規定値	説明
batchSize	integer		パフォーマンスを向上させるために、データソースから読み取られ、1 つのバッチとしてインデックスが作成される項目の数。既定値は、データソースの種類によって異なります。
configuration	IndexingParametersConfiguration		インデクサー固有の構成プロパティのディクショナリ。各名前は、特定のプロパティの名前です。各値はプリミティブ型である必要があります。
maxFailedItems	integer	0	インデクサーの実行が成功したと見なされるためにインデックス作成に失敗する可能性がある項目の最大数。 -1 は制限がないことを意味します。既定値は 0 です。
maxFailedItemsPerBatch	integer	0	バッチのインデックス作成に失敗しても成功と見なされる可能性がある、1 つのバッチ内の項目の最大数。 -1 は制限がないことを意味します。既定値は 0 です。

IndexingParametersConfiguration

インデクサー固有の構成プロパティのディクショナリ。各名前は、特定のプロパティの名前です。各値はプリミティブ型である必要があります。

名前	型	規定値	説明
allowSkillsetToReadFileData	boolean	False	true の場合、BLOB データソースからダウンロードされた元のファイルデータを表すオブジェクトであるパス //document//file_data が作成されます。これにより、元のファイルデータをエンリッチメントパイプライン内で処理するためのカスタムスキルまたはドキュメント抽出スキルに渡すことができます。
dataToExtract	BlobIndexerDataToExtract	contentAndMetadata	Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、イメージコンテンツから抽出するデータをインデクサーに指示します。これは、.PDFまたはその他のアプリケーションの埋め込みイメージコンテンツ、または Azure BLOB の .jpg や .pngなどのイメージファイルに適用されます。
delimitedTextDelimiter	string		CSV BLOB の場合、各行が新しいドキュメント ("\|" など) を開始する CSV ファイルの行末の単一文字区切り記号を指定します。
delimitedTextHeaders	string		CSV BLOB の場合、列ヘッダーのコンマ区切りのリストを指定します。これは、ソースフィールドをインデックス内の宛先フィールドにマッピングするのに役立ちます。
documentRoot	string		JSON 配列の場合、構造化ドキュメントまたは半構造化ドキュメントを指定すると、このプロパティを使用して配列へのパスを指定できます。
excludedFileNameExtensions	string		Azure BLOB ストレージからの処理時に無視するファイル名拡張子のコンマ区切りの一覧。たとえば、".png、.mp4" を除外して、インデックス作成中にこれらのファイルをスキップできます。
executionEnvironment	IndexerExecutionEnvironment	standard	インデクサーを実行する環境を指定します。
failOnUnprocessableDocument	boolean	False	Azure BLOB の場合、ドキュメントのインデックス作成に失敗した場合にインデックス作成を続行する場合は false に設定します。
failOnUnsupportedContentType	boolean	False	Azure BLOB の場合、サポートされていないコンテンツタイプが検出されたときにインデックス作成を続行する必要があり、すべてのコンテンツタイプ (ファイル拡張子) を事前に把握していない場合は false に設定します。
firstLineContainsHeaders	boolean	True	CSV BLOB の場合、各 BLOB の最初の (空白以外の) 行にヘッダーが含まれていることを示します。
imageAction	BlobIndexerImageAction	none	Azure BLOB ストレージ内の埋め込みイメージとイメージファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。
indexStorageMetadataOnlyForOversizedDocuments	boolean	False	Azure BLOB の場合、処理するには大きすぎる BLOB コンテンツのストレージメタデータのインデックスを作成するには、このプロパティを true に設定します。サイズ超過の BLOB は、既定でエラーとして扱われます。 BLOB サイズの制限については、https://learn.microsoft.com/azure/search/search-limits-quotas-capacityを参照してください。
indexedFileNameExtensions	string		Azure Blob Storage から処理するときに選択するファイル名拡張子のコンマ区切りの一覧。たとえば、特定のアプリケーションファイル ".docx、.pptx、.msg" にインデックスを付けて、これらのファイルの種類を具体的に含めることができます。
markdownHeaderDepth	MarkdownHeaderDepth	h6	マークダウンコンテンツのグループ化中に考慮されるヘッダーの最大深度を指定します。既定値は `h6`です。
markdownParsingSubmode	MarkdownParsingSubmode	oneToMany	マークダウンファイルを 1 つの検索ドキュメントと複数の検索ドキュメントのどちらに解析するかを決定するサブモードを指定します。既定値は `oneToMany`です。
parsingMode	BlobIndexerParsingMode	default	Azure BLOB データソースからのインデックス作成の解析モードを表します。
pdfTextRotationAlgorithm	BlobIndexerPDFTextRotationAlgorithm	none	Azure BLOB ストレージ内の PDF ファイルからテキストを抽出するためのアルゴリズムを決定します。
queryTimeout	string	00:05:00	"hh:mm:ss" という形式で指定された Azure SQL データベースデータソースの 5 分間の既定値を超えてタイムアウトを増やします。

IndexingSchedule

インデクサー実行のスケジュールを表します。

名前	型	説明
interval	string	インデクサーの実行間隔。
startTime	string	インデクサーの実行を開始する時刻。

MarkdownHeaderDepth

マークダウンコンテンツのグループ化中に考慮されるヘッダーの最大深度を指定します。既定値は h6です。

名前	型	説明
h1	string	マークダウンコンテンツをグループ化するときに、h1 レベルまでのヘッダーが考慮されることを示します。
h2	string	マークダウンコンテンツをグループ化するときに、h2 レベルまでのヘッダーが考慮されることを示します。
h3	string	マークダウンコンテンツをグループ化するときに、h3 レベルまでのヘッダーが考慮されることを示します。
h4	string	マークダウンコンテンツをグループ化するときに、h4 レベルまでのヘッダーが考慮されることを示します。
h5	string	マークダウンコンテンツをグループ化するときに、h5 レベルまでのヘッダーが考慮されることを示します。
h6	string	マークダウンコンテンツをグループ化するときに、h6 レベルまでのヘッダーが考慮されることを示します。これが既定値です。

MarkdownParsingSubmode

マークダウンファイルを 1 つの検索ドキュメントと複数の検索ドキュメントのどちらに解析するかを決定するサブモードを指定します。既定値は oneToManyです。

名前	型	説明
oneToMany	string	マークダウンファイルの各セクション (指定された深さまで) が個々の検索ドキュメントに解析されることを示します。これにより、1 つのマークダウンファイルで複数の検索ドキュメントが生成される可能性があります。これが既定のサブモードです。
oneToOne	string	各マークダウンファイルが 1 つの検索ドキュメントに解析されることを示します。

SearchIndexer

インデクサーを表します。

名前	型	規定値	説明
@odata.etag	string		インデクサーの ETag。
cache	SearchIndexerCache		エンリッチメントパイプラインにキャッシュを追加して、インデックスを毎回再構築することなく増分変更手順を実行できるようにします。
dataSourceName	string		このインデクサーがデータを読み取るデータソースの名前。
description	string		インデクサーの説明。
disabled	boolean	False	インデクサーが無効かどうかを示す値。既定値は false です。
encryptionKey	SearchResourceEncryptionKey		Azure Key Vault で作成する暗号化キーの説明。このキーは、インデクサー定義 (およびインデクサーの実行状態) に追加のレベルの保存時暗号化を提供するために使用されます。これは、Microsoft 以外のユーザーが暗号化を解除できないという完全な保証が必要な場合です。インデクサー定義を暗号化すると、常に暗号化されたままになります。検索サービスは、このプロパティを null に設定する試行を無視します。暗号化キーをローテーションする場合は、必要に応じてこのプロパティを変更できます。インデクサー定義 (およびインデクサーの実行状態) は影響を受けません。カスタマーマネージドキーを使用した暗号化は、無料の検索サービスでは使用できません。また、2019 年 1 月 1 日以降に作成された有料サービスでのみ使用できます。
fieldMappings	FieldMapping[]		データソース内のフィールドとインデックス内の対応するターゲットフィールド間のマッピングを定義します。
name	string		インデクサーの名前。
outputFieldMappings	FieldMapping[]		出力フィールドマッピングは、エンリッチメントの後、インデックス作成の直前に適用されます。
parameters	IndexingParameters		インデクサー実行のパラメーター。
schedule	IndexingSchedule		このインデクサーのスケジュール。
skillsetName	string		このインデクサーで実行されているスキルセットの名前。
targetIndexName	string		このインデクサーがデータを書き込むインデックスの名前。

SearchIndexerCache

名前	型	説明
enableReprocessing	boolean	増分再処理を有効にするかどうかを指定します。
identity	SearchIndexerDataIdentity: SearchIndexerDataNoneIdentity SearchIndexerDataUserAssignedIdentity	エンリッチメントキャッシュへの接続に使用されるユーザー割り当てマネージド ID。接続文字列が ID (ResourceId) を示し、指定されていない場合は、システム割り当てマネージド ID が使用されます。インデクサーの更新時に、ID が指定されていない場合、値は変更されません。 "none" に設定すると、このプロパティの値はクリアされます。
storageConnectionString	string	キャッシュデータが永続化されるストレージアカウントへの接続文字列。

SearchIndexerDataNoneIdentity

データソースの ID プロパティをクリアします。

名前	型	説明
@odata.type	string: #Microsoft.Azure.Search.DataNoneIdentity	ID の種類を指定する URI フラグメント。

SearchIndexerDataUserAssignedIdentity

使用するデータソースの ID を指定します。

名前	型	説明
@odata.type	string: #Microsoft.Azure.Search.DataUserAssignedIdentity	ID の種類を指定する URI フラグメント。
userAssignedIdentity	string	通常、ユーザー割り当てマネージド ID の完全修飾 Azure リソース ID は、検索サービスに割り当てられている必要がある "/subscriptions/12345678-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" の形式です。

SearchResourceEncryptionKey

Azure Key Vault のカスタマーマネージド暗号化キー。作成および管理するキーは、インデックスやシノニムマップなどの保存データの暗号化または暗号化解除に使用できます。

名前	型	説明
accessCredentials	AzureActiveDirectoryApplicationCredentials	Azure Key Vault へのアクセスに使用されるオプションの Azure Active Directory 資格情報。代わりにマネージド ID を使用する場合は必要ありません。
identity	SearchIndexerDataIdentity: SearchIndexerDataNoneIdentity SearchIndexerDataUserAssignedIdentity	この暗号化キーに使用する明示的なマネージド ID。指定されず、アクセス資格情報プロパティが null の場合は、システム割り当てマネージド ID が使用されます。リソースの更新時に、明示的な ID が指定されていない場合、変更されません。 "none" が指定されている場合、このプロパティの値はクリアされます。
keyVaultKeyName	string	保存データの暗号化に使用する Azure Key Vault キーの名前。
keyVaultKeyVersion	string	保存データの暗号化に使用する Azure Key Vault キーのバージョン。
keyVaultUri	string	保存データの暗号化に使用するキーを含む Azure Key Vault の URI (DNS 名とも呼ばれます)。 URI の例は、`https://my-keyvault-name.vault.azure.net`可能性があります。

次の方法で共有