Indexers - Get
インデクサー定義を取得します。
GET {endpoint}/indexers('{indexerName}')?api-version=2024-11-01-preview
URI パラメーター
名前 | / | 必須 | 型 | 説明 |
---|---|---|---|---|
endpoint
|
path | True |
string |
検索サービスのエンドポイント URL。 |
indexer
|
path | True |
string |
取得するインデクサーの名前。 |
api-version
|
query | True |
string |
クライアント API のバージョン。 |
要求ヘッダー
名前 | 必須 | 型 | 説明 |
---|---|---|---|
x-ms-client-request-id |
string uuid |
デバッグに役立つ要求と共に送信される追跡 ID。 |
応答
名前 | 型 | 説明 |
---|---|---|
200 OK | ||
Other Status Codes |
エラー応答。 |
例
SearchServiceGetIndexer
要求のサンプル
GET https://previewexampleservice.search.windows.net/indexers('myindexer')?api-version=2024-11-01-preview
応答のサンプル
{
"@odata.etag": "0x1234568AE7E58A1",
"name": "myindexer",
"description": "Description of the indexer",
"dataSourceName": "mydocdbdatasource",
"skillsetName": "myskillset",
"targetIndexName": "preview-test",
"disabled": false,
"schedule": {
"interval": "P1D",
"startTime": "2024-06-06T00:01:50.265Z"
},
"parameters": {
"maxFailedItems": 10,
"maxFailedItemsPerBatch": 5,
"configuration": {}
},
"fieldMappings": [],
"outputFieldMappings": [],
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": "<applicationSecret>"
}
}
}
定義
名前 | 説明 |
---|---|
Azure |
Azure Key Vault に格納されている暗号化キーへの認証済みアクセスに使用される、検索サービス用に作成された登録済みアプリケーションの資格情報。 |
Blob |
Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、イメージ コンテンツから抽出するデータをインデクサーに指示します。 これは、.PDFまたはその他のアプリケーションの埋め込みイメージ コンテンツ、または Azure BLOB の .jpg や .pngなどのイメージ ファイルに適用されます。 |
Blob |
Azure BLOB ストレージ内の埋め込みイメージとイメージ ファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。 |
Blob |
Azure BLOB データ ソースからのインデックス作成の解析モードを表します。 |
Blob |
Azure BLOB ストレージ内の PDF ファイルからテキストを抽出するためのアルゴリズムを決定します。 |
Error |
リソース管理エラーの追加情報。 |
Error |
エラーの詳細。 |
Error |
エラー応答 |
Field |
データ ソース内のフィールドとインデックス内のターゲット フィールドの間のマッピングを定義します。 |
Field |
インデックス作成の前にデータ ソースから値を変換する関数を表します。 |
Indexer |
インデクサーを実行する環境を指定します。 |
Indexing |
インデクサー実行のパラメーターを表します。 |
Indexing |
インデクサー固有の構成プロパティのディクショナリ。 各名前は、特定のプロパティの名前です。 各値はプリミティブ型である必要があります。 |
Indexing |
インデクサー実行のスケジュールを表します。 |
Markdown |
マークダウン コンテンツのグループ化中に考慮されるヘッダーの最大深度を指定します。 既定値は |
Markdown |
マークダウン ファイルを 1 つの検索ドキュメントと複数の検索ドキュメントのどちらに解析するかを決定するサブモードを指定します。 既定値は |
Search |
インデクサーを表します。 |
Search |
|
Search |
データソースの ID プロパティをクリアします。 |
Search |
使用するデータソースの ID を指定します。 |
Search |
Azure Key Vault のカスタマー マネージド暗号化キー。 作成および管理するキーは、インデックスやシノニム マップなどの保存データの暗号化または暗号化解除に使用できます。 |
AzureActiveDirectoryApplicationCredentials
Azure Key Vault に格納されている暗号化キーへの認証済みアクセスに使用される、検索サービス用に作成された登録済みアプリケーションの資格情報。
名前 | 型 | 説明 |
---|---|---|
applicationId |
string |
保存データの暗号化時に使用される Azure Key Vault に対する必要なアクセス許可が付与された AAD アプリケーション ID。 アプリケーション ID は、AAD アプリケーションのオブジェクト ID と混同しないでください。 |
applicationSecret |
string |
指定した AAD アプリケーションの認証キー。 |
BlobIndexerDataToExtract
Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、イメージ コンテンツから抽出するデータをインデクサーに指示します。 これは、.PDFまたはその他のアプリケーションの埋め込みイメージ コンテンツ、または Azure BLOB の .jpg や .pngなどのイメージ ファイルに適用されます。
名前 | 型 | 説明 |
---|---|---|
allMetadata |
string |
Azure BLOB ストレージ サブシステムによって提供されるメタデータとコンテンツ タイプ固有のメタデータ (たとえば、.png ファイルのみに固有のメタデータがインデックス付けされる) を抽出します。 |
contentAndMetadata |
string |
各 BLOB からすべてのメタデータとテキスト コンテンツを抽出します。 |
storageMetadata |
string |
標準の BLOB プロパティとユーザー指定のメタデータのみにインデックスを作成します。 |
BlobIndexerImageAction
Azure BLOB ストレージ内の埋め込みイメージとイメージ ファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。
名前 | 型 | 説明 |
---|---|---|
generateNormalizedImagePerPage |
string |
画像からテキスト (たとえば、トラフィック停止記号から "STOP" という単語) を抽出し、コンテンツ フィールドに埋め込みますが、埋め込み画像を抽出するのではなく、各ページが画像としてレンダリングされ、それに応じて正規化されるという点で、PDF ファイルを異なる方法で処理します。 PDF 以外のファイルの種類は、"generateNormalizedImages" が設定された場合と同じように扱われます。 |
generateNormalizedImages |
string |
画像からテキスト (たとえば、トラフィック停止記号から "STOP" という単語) を抽出し、コンテンツ フィールドに埋め込みます。 このアクションでは、"dataToExtract" が "contentAndMetadata" に設定されている必要があります。 正規化された画像とは、画像を視覚的な検索結果に含めるときに、一貫したレンダリングを促進するためにサイズを変更し、回転して均一な画像出力を生成する追加処理を指します。 この情報は、このオプションを使用すると各イメージに対して生成されます。 |
none |
string |
データ セット内の埋め込みイメージまたはイメージ ファイルを無視します。 これが既定値です。 |
BlobIndexerParsingMode
Azure BLOB データ ソースからのインデックス作成の解析モードを表します。
名前 | 型 | 説明 |
---|---|---|
default |
string |
通常のファイル処理では既定値に設定されます。 |
delimitedText |
string |
BLOB がプレーン CSV ファイルの場合は、delimitedText に設定します。 |
json |
string |
JSON ファイルから構造化コンテンツを抽出するには、json に設定します。 |
jsonArray |
string |
JSON 配列の個々の要素を個別のドキュメントとして抽出するには、jsonArray に設定します。 |
jsonLines |
string |
jsonLines に設定すると、個別のドキュメントとして、新しい行で区切られた個々の JSON エンティティが抽出されます。 |
markdown |
string |
マークダウン ファイルからコンテンツを抽出するには、markdown に設定します。 |
text |
string |
BLOB ストレージ内のプレーン テキスト ファイルのインデックス作成のパフォーマンスを向上させるために、テキストに設定します。 |
BlobIndexerPDFTextRotationAlgorithm
Azure BLOB ストレージ内の PDF ファイルからテキストを抽出するためのアルゴリズムを決定します。
名前 | 型 | 説明 |
---|---|---|
detectAngles |
string |
PDF ファイル内のテキストを回転させた PDF ファイルから、より読みやすく、読みやすいテキスト抽出が生成される場合があります。 このパラメーターを使用すると、パフォーマンス速度への影響が小さくなる可能性があることに注意してください。 このパラメーターは PDF ファイルにのみ適用され、テキストが埋め込まれた PDF にのみ適用されます。 回転したテキストが PDF の埋め込み画像内に表示される場合、このパラメーターは適用されません。 |
none |
string |
通常のテキスト抽出を利用します。 これが既定値です。 |
ErrorAdditionalInfo
リソース管理エラーの追加情報。
名前 | 型 | 説明 |
---|---|---|
info |
object |
追加情報。 |
type |
string |
追加情報の種類。 |
ErrorDetail
エラーの詳細。
名前 | 型 | 説明 |
---|---|---|
additionalInfo |
エラーの追加情報。 |
|
code |
string |
エラー コード。 |
details |
エラーの詳細。 |
|
message |
string |
エラー メッセージ。 |
target |
string |
エラーターゲット。 |
ErrorResponse
エラー応答
名前 | 型 | 説明 |
---|---|---|
error |
エラー オブジェクト。 |
FieldMapping
データ ソース内のフィールドとインデックス内のターゲット フィールドの間のマッピングを定義します。
名前 | 型 | 説明 |
---|---|---|
mappingFunction |
インデックスを作成する前に各ソース フィールド値に適用する関数。 |
|
sourceFieldName |
string |
データ ソース内のフィールドの名前。 |
targetFieldName |
string |
インデックス内のターゲット フィールドの名前。 既定では、ソース フィールド名と同じです。 |
FieldMappingFunction
インデックス作成の前にデータ ソースから値を変換する関数を表します。
名前 | 型 | 説明 |
---|---|---|
name |
string |
フィールド マッピング関数の名前。 |
parameters |
object |
関数に渡すパラメーター名と値のペアのディクショナリ。 各値はプリミティブ型である必要があります。 |
IndexerExecutionEnvironment
インデクサーを実行する環境を指定します。
名前 | 型 | 説明 |
---|---|---|
private |
string |
検索サービス専用にプロビジョニングされた環境でインデクサーを実行する必要があることを示します。 これは、インデクサーが共有プライベート リンク リソース経由でリソースに安全にアクセスする必要がある場合にのみ、実行環境として指定する必要があります。 |
standard |
string |
検索サービスがインデクサーを実行する場所を決定できることを示します。 これは、何も指定されていない場合の既定の環境であり、推奨される値です。 |
IndexingParameters
インデクサー実行のパラメーターを表します。
名前 | 型 | 規定値 | 説明 |
---|---|---|---|
batchSize |
integer |
パフォーマンスを向上させるために、データ ソースから読み取られ、1 つのバッチとしてインデックスが作成される項目の数。 既定値は、データ ソースの種類によって異なります。 |
|
configuration |
インデクサー固有の構成プロパティのディクショナリ。 各名前は、特定のプロパティの名前です。 各値はプリミティブ型である必要があります。 |
||
maxFailedItems |
integer |
0 |
インデクサーの実行が成功したと見なされるためにインデックス作成に失敗する可能性がある項目の最大数。 -1 は制限がないことを意味します。 既定値は 0 です。 |
maxFailedItemsPerBatch |
integer |
0 |
バッチのインデックス作成に失敗しても成功と見なされる可能性がある、1 つのバッチ内の項目の最大数。 -1 は制限がないことを意味します。 既定値は 0 です。 |
IndexingParametersConfiguration
インデクサー固有の構成プロパティのディクショナリ。 各名前は、特定のプロパティの名前です。 各値はプリミティブ型である必要があります。
名前 | 型 | 規定値 | 説明 |
---|---|---|---|
allowSkillsetToReadFileData |
boolean |
False |
true の場合、BLOB データ ソースからダウンロードされた元のファイル データを表すオブジェクトであるパス //document//file_data が作成されます。 これにより、元のファイル データをエンリッチメント パイプライン内で処理するためのカスタム スキルまたはドキュメント抽出スキルに渡すことができます。 |
dataToExtract | contentAndMetadata |
Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、イメージ コンテンツから抽出するデータをインデクサーに指示します。 これは、.PDFまたはその他のアプリケーションの埋め込みイメージ コンテンツ、または Azure BLOB の .jpg や .pngなどのイメージ ファイルに適用されます。 |
|
delimitedTextDelimiter |
string |
CSV BLOB の場合、各行が新しいドキュメント ("|" など) を開始する CSV ファイルの行末の単一文字区切り記号を指定します。 |
|
delimitedTextHeaders |
string |
CSV BLOB の場合、列ヘッダーのコンマ区切りのリストを指定します。これは、ソース フィールドをインデックス内の宛先フィールドにマッピングするのに役立ちます。 |
|
documentRoot |
string |
JSON 配列の場合、構造化ドキュメントまたは半構造化ドキュメントを指定すると、このプロパティを使用して配列へのパスを指定できます。 |
|
excludedFileNameExtensions |
string |
Azure BLOB ストレージからの処理時に無視するファイル名拡張子のコンマ区切りの一覧。 たとえば、".png、.mp4" を除外して、インデックス作成中にこれらのファイルをスキップできます。 |
|
executionEnvironment | standard |
インデクサーを実行する環境を指定します。 |
|
failOnUnprocessableDocument |
boolean |
False |
Azure BLOB の場合、ドキュメントのインデックス作成に失敗した場合にインデックス作成を続行する場合は false に設定します。 |
failOnUnsupportedContentType |
boolean |
False |
Azure BLOB の場合、サポートされていないコンテンツ タイプが検出されたときにインデックス作成を続行する必要があり、すべてのコンテンツ タイプ (ファイル拡張子) を事前に把握していない場合は false に設定します。 |
firstLineContainsHeaders |
boolean |
True |
CSV BLOB の場合、各 BLOB の最初の (空白以外の) 行にヘッダーが含まれていることを示します。 |
imageAction | none |
Azure BLOB ストレージ内の埋め込みイメージとイメージ ファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。 |
|
indexStorageMetadataOnlyForOversizedDocuments |
boolean |
False |
Azure BLOB の場合、処理するには大きすぎる BLOB コンテンツのストレージ メタデータのインデックスを作成するには、このプロパティを true に設定します。 サイズ超過の BLOB は、既定でエラーとして扱われます。 BLOB サイズの制限については、https://learn.microsoft.com/azure/search/search-limits-quotas-capacityを参照してください。 |
indexedFileNameExtensions |
string |
Azure Blob Storage から処理するときに選択するファイル名拡張子のコンマ区切りの一覧。 たとえば、特定のアプリケーション ファイル ".docx、.pptx、.msg" にインデックスを付けて、これらのファイルの種類を具体的に含めることができます。 |
|
markdownHeaderDepth | h6 |
マークダウン コンテンツのグループ化中に考慮されるヘッダーの最大深度を指定します。 既定値は |
|
markdownParsingSubmode | oneToMany |
マークダウン ファイルを 1 つの検索ドキュメントと複数の検索ドキュメントのどちらに解析するかを決定するサブモードを指定します。 既定値は |
|
parsingMode | default |
Azure BLOB データ ソースからのインデックス作成の解析モードを表します。 |
|
pdfTextRotationAlgorithm | none |
Azure BLOB ストレージ内の PDF ファイルからテキストを抽出するためのアルゴリズムを決定します。 |
|
queryTimeout |
string |
00:05:00 |
"hh:mm:ss" という形式で指定された Azure SQL データベース データ ソースの 5 分間の既定値を超えてタイムアウトを増やします。 |
IndexingSchedule
インデクサー実行のスケジュールを表します。
名前 | 型 | 説明 |
---|---|---|
interval |
string |
インデクサーの実行間隔。 |
startTime |
string |
インデクサーの実行を開始する時刻。 |
MarkdownHeaderDepth
マークダウン コンテンツのグループ化中に考慮されるヘッダーの最大深度を指定します。 既定値は h6
です。
名前 | 型 | 説明 |
---|---|---|
h1 |
string |
マークダウン コンテンツをグループ化するときに、h1 レベルまでのヘッダーが考慮されることを示します。 |
h2 |
string |
マークダウン コンテンツをグループ化するときに、h2 レベルまでのヘッダーが考慮されることを示します。 |
h3 |
string |
マークダウン コンテンツをグループ化するときに、h3 レベルまでのヘッダーが考慮されることを示します。 |
h4 |
string |
マークダウン コンテンツをグループ化するときに、h4 レベルまでのヘッダーが考慮されることを示します。 |
h5 |
string |
マークダウン コンテンツをグループ化するときに、h5 レベルまでのヘッダーが考慮されることを示します。 |
h6 |
string |
マークダウン コンテンツをグループ化するときに、h6 レベルまでのヘッダーが考慮されることを示します。 これが既定値です。 |
MarkdownParsingSubmode
マークダウン ファイルを 1 つの検索ドキュメントと複数の検索ドキュメントのどちらに解析するかを決定するサブモードを指定します。 既定値は oneToMany
です。
名前 | 型 | 説明 |
---|---|---|
oneToMany |
string |
マークダウン ファイルの各セクション (指定された深さまで) が個々の検索ドキュメントに解析されることを示します。 これにより、1 つのマークダウン ファイルで複数の検索ドキュメントが生成される可能性があります。 これが既定のサブモードです。 |
oneToOne |
string |
各マークダウン ファイルが 1 つの検索ドキュメントに解析されることを示します。 |
SearchIndexer
インデクサーを表します。
名前 | 型 | 規定値 | 説明 |
---|---|---|---|
@odata.etag |
string |
インデクサーの ETag。 |
|
cache |
エンリッチメント パイプラインにキャッシュを追加して、インデックスを毎回再構築することなく増分変更手順を実行できるようにします。 |
||
dataSourceName |
string |
このインデクサーがデータを読み取るデータソースの名前。 |
|
description |
string |
インデクサーの説明。 |
|
disabled |
boolean |
False |
インデクサーが無効かどうかを示す値。 既定値は false です。 |
encryptionKey |
Azure Key Vault で作成する暗号化キーの説明。 このキーは、インデクサー定義 (およびインデクサーの実行状態) に追加のレベルの保存時暗号化を提供するために使用されます。これは、Microsoft 以外のユーザーが暗号化を解除できないという完全な保証が必要な場合です。 インデクサー定義を暗号化すると、常に暗号化されたままになります。 検索サービスは、このプロパティを null に設定する試行を無視します。 暗号化キーをローテーションする場合は、必要に応じてこのプロパティを変更できます。インデクサー定義 (およびインデクサーの実行状態) は影響を受けません。 カスタマー マネージド キーを使用した暗号化は、無料の検索サービスでは使用できません。また、2019 年 1 月 1 日以降に作成された有料サービスでのみ使用できます。 |
||
fieldMappings |
データ ソース内のフィールドとインデックス内の対応するターゲット フィールド間のマッピングを定義します。 |
||
name |
string |
インデクサーの名前。 |
|
outputFieldMappings |
出力フィールド マッピングは、エンリッチメントの後、インデックス作成の直前に適用されます。 |
||
parameters |
インデクサー実行のパラメーター。 |
||
schedule |
このインデクサーのスケジュール。 |
||
skillsetName |
string |
このインデクサーで実行されているスキルセットの名前。 |
|
targetIndexName |
string |
このインデクサーがデータを書き込むインデックスの名前。 |
SearchIndexerCache
名前 | 型 | 説明 |
---|---|---|
enableReprocessing |
boolean |
増分再処理を有効にするかどうかを指定します。 |
identity | SearchIndexerDataIdentity: |
エンリッチメント キャッシュへの接続に使用されるユーザー割り当てマネージド ID。 接続文字列が ID (ResourceId) を示し、指定されていない場合は、システム割り当てマネージド ID が使用されます。 インデクサーの更新時に、ID が指定されていない場合、値は変更されません。 "none" に設定すると、このプロパティの値はクリアされます。 |
storageConnectionString |
string |
キャッシュ データが永続化されるストレージ アカウントへの接続文字列。 |
SearchIndexerDataNoneIdentity
データソースの ID プロパティをクリアします。
名前 | 型 | 説明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
ID の種類を指定する URI フラグメント。 |
SearchIndexerDataUserAssignedIdentity
使用するデータソースの ID を指定します。
名前 | 型 | 説明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
ID の種類を指定する URI フラグメント。 |
userAssignedIdentity |
string |
通常、ユーザー割り当てマネージド ID の完全修飾 Azure リソース ID は、検索サービスに割り当てられている必要がある "/subscriptions/12345678-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" の形式です。 |
SearchResourceEncryptionKey
Azure Key Vault のカスタマー マネージド暗号化キー。 作成および管理するキーは、インデックスやシノニム マップなどの保存データの暗号化または暗号化解除に使用できます。
名前 | 型 | 説明 |
---|---|---|
accessCredentials |
Azure Key Vault へのアクセスに使用されるオプションの Azure Active Directory 資格情報。 代わりにマネージド ID を使用する場合は必要ありません。 |
|
identity | SearchIndexerDataIdentity: |
この暗号化キーに使用する明示的なマネージド ID。 指定されず、アクセス資格情報プロパティが null の場合は、システム割り当てマネージド ID が使用されます。 リソースの更新時に、明示的な ID が指定されていない場合、変更されません。 "none" が指定されている場合、このプロパティの値はクリアされます。 |
keyVaultKeyName |
string |
保存データの暗号化に使用する Azure Key Vault キーの名前。 |
keyVaultKeyVersion |
string |
保存データの暗号化に使用する Azure Key Vault キーのバージョン。 |
keyVaultUri |
string |
保存データの暗号化に使用するキーを含む Azure Key Vault の URI (DNS 名とも呼ばれます)。 URI の例は、 |