Indexers - Get
Načte definici indexeru.
GET {endpoint}/indexers('{indexerName}')?api-version=2024-05-01-preview
Parametry identifikátoru URI
Name | V | Vyžadováno | Typ | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Adresa URL koncového bodu vyhledávací služby. |
indexer
|
path | True |
string |
Název indexeru, který se má načíst. |
api-version
|
query | True |
string |
Verze rozhraní API klienta. |
Hlavička požadavku
Name | Vyžadováno | Typ | Description |
---|---|---|---|
x-ms-client-request-id |
string uuid |
ID sledování odeslané spolu s požadavkem na pomoc s laděním. |
Odpovědi
Name | Typ | Description |
---|---|---|
200 OK | ||
Other Status Codes |
Odpověď na chybu. |
Příklady
SearchServiceGetIndexer
Ukázkový požadavek
GET https://myservice.search.windows.net/indexers('myindexer')?api-version=2024-05-01-preview
Ukázková odpověď
{
"name": "myindexer",
"description": "a cool indexer",
"dataSourceName": "mydatasource",
"targetIndexName": "orders",
"schedule": {
"interval": "PT1H",
"startTime": "2015-01-01T00:00:00Z"
},
"parameters": {
"maxFailedItems": 10,
"maxFailedItemsPerBatch": 5
},
"fieldMappings": [],
"disabled": false,
"encryptionKey": {
"keyVaultKeyName": "myKeyName",
"keyVaultKeyVersion": "myKeyVersion",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": null
}
}
}
Definice
Name | Description |
---|---|
Azure |
Přihlašovací údaje registrované aplikace vytvořené pro vaši vyhledávací službu, které slouží k ověřenému přístupu k šifrovacím klíčům uloženým v Azure Key Vault. |
Blob |
Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je imageAction nastavená na jinou hodnotu než "none". To platí pro vložený obsah obrázků v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure. |
Blob |
Určuje, jak zpracovávat vložené obrázky a soubory obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jinou hodnotu než "none" vyžaduje, aby byla k danému indexeru připojena také sada dovedností. |
Blob |
Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure. |
Blob |
Určuje algoritmus pro extrakci textu ze souborů PDF ve službě Azure Blob Storage. |
Error |
Další informace o chybě správy prostředků |
Error |
Podrobnosti o chybě |
Error |
Chybová odpověď |
Field |
Definuje mapování mezi polem ve zdroji dat a cílovým polem v indexu. |
Field |
Představuje funkci, která transformuje hodnotu ze zdroje dat před indexováním. |
Indexer |
Určuje prostředí, ve kterém se má indexer spustit. |
Indexing |
Představuje parametry pro spuštění indexeru. |
Indexing |
Slovník vlastností konfigurace specifických pro indexer. Každý název je název konkrétní vlastnosti. Každá hodnota musí být primitivního typu. |
Indexing |
Představuje plán spuštění indexeru. |
Search |
Představuje indexer. |
Search |
|
Search |
Vymaže vlastnost identity zdroje dat. |
Search |
Určuje identitu pro zdroj dat, který se má použít. |
Search |
Šifrovací klíč spravovaný zákazníkem v Azure Key Vault. Klíče, které vytvoříte a spravujete, můžete použít k šifrování nebo dešifrování neaktivních uložených dat, jako jsou indexy a mapy synonym. |
AzureActiveDirectoryApplicationCredentials
Přihlašovací údaje registrované aplikace vytvořené pro vaši vyhledávací službu, které slouží k ověřenému přístupu k šifrovacím klíčům uloženým v Azure Key Vault.
Name | Typ | Description |
---|---|---|
applicationId |
string |
ID aplikace AAD, kterému byla udělena požadovaná přístupová oprávnění k azure Key Vault, která se mají použít při šifrování neaktivních uložených dat. ID aplikace by se nemělo zaměňovat s ID objektu vaší aplikace AAD. |
applicationSecret |
string |
Ověřovací klíč zadané aplikace AAD. |
BlobIndexerDataToExtract
Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je imageAction nastavená na jinou hodnotu než "none". To platí pro vložený obsah obrázků v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure.
Name | Typ | Description |
---|---|---|
allMetadata |
string |
Extrahuje metadata poskytovaná subsystémem Úložiště objektů blob v Azure a metadata specifická pro obsah (například metadata jedinečná jenom pro .png soubory se indexují). |
contentAndMetadata |
string |
Extrahuje všechna metadata a textový obsah z každého objektu blob. |
storageMetadata |
string |
Indexuje pouze standardní vlastnosti objektu blob a metadata zadaná uživatelem. |
BlobIndexerImageAction
Určuje, jak zpracovávat vložené obrázky a soubory obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jinou hodnotu než "none" vyžaduje, aby byla k danému indexeru připojena také sada dovedností.
Name | Typ | Description |
---|---|---|
generateNormalizedImagePerPage |
string |
Extrahuje text z obrázků (například slovo "STOP" ze symbolu zastavení provozu) a vloží ho do pole obsahu, ale zachází se soubory PDF odlišně v tom, že každá stránka se vykresluje jako obrázek a odpovídajícím způsobem normalizuje místo extrahování vložených obrázků. S typy souborů bez PDF se bude zacházet stejně, jako kdyby byla nastavena hodnota generateNormalizedImages. |
generateNormalizedImages |
string |
Extrahuje text z obrázků (například slovo "STOP" ze symbolu zastavení provozu) a vloží ho do pole obsahu. Tato akce vyžaduje, aby hodnota dataToExtract byla nastavena na contentAndMetadata. Normalizovaný obrázek označuje další zpracování, jehož výsledkem je rovnoměrný výstup obrázku, jeho velikost a otočení, aby se při zahrnutí obrázků do vizuálních výsledků hledání podpořilo konzistentní vykreslování. Tyto informace se při použití této možnosti vygenerují pro každou image. |
none |
string |
Ignoruje vložené obrázky nebo soubory obrázků v datové sadě. Tato možnost je výchozí. |
BlobIndexerParsingMode
Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure.
Name | Typ | Description |
---|---|---|
default |
string |
Pro normální zpracování souborů nastavte výchozí hodnotu. |
delimitedText |
string |
Pokud jsou objekty blob prostými soubory CSV, nastavte na hodnotu delimitedText. |
json |
string |
Pokud chcete extrahovat strukturovaný obsah ze souborů JSON, nastavte na json. |
jsonArray |
string |
Nastavením na jsonArray extrahujte jednotlivé prvky pole JSON jako samostatné dokumenty. |
jsonLines |
string |
Nastavením na jsonLines extrahujte jednotlivé entity JSON oddělené novým řádkem jako samostatné dokumenty. |
text |
string |
Nastavením na text zlepšíte výkon indexování souborů ve formátu prostého textu v úložišti objektů blob. |
BlobIndexerPDFTextRotationAlgorithm
Určuje algoritmus pro extrakci textu ze souborů PDF ve službě Azure Blob Storage.
Name | Typ | Description |
---|---|---|
detectAngles |
string |
Může vytvářet lepší a čitelnější extrakci textu ze souborů PDF, které mají otočený text v nich. Všimněte si, že při použití tohoto parametru může dojít k malému dopadu na rychlost výkonu. Tento parametr platí pouze pro soubory PDF a pouze pro soubory PDF s vloženým textem. Pokud se otočený text zobrazí ve vloženém obrázku v PDF, tento parametr se nepoužije. |
none |
string |
Využívá normální extrakci textu. Tato možnost je výchozí. |
ErrorAdditionalInfo
Další informace o chybě správy prostředků
Name | Typ | Description |
---|---|---|
info |
object |
Další informace. |
type |
string |
Další typ informací. |
ErrorDetail
Podrobnosti o chybě
Name | Typ | Description |
---|---|---|
additionalInfo |
Další informace o chybě. |
|
code |
string |
Kód chyby |
details |
Podrobnosti o chybě. |
|
message |
string |
Chybová zpráva |
target |
string |
Cíl chyby. |
ErrorResponse
Chybová odpověď
Name | Typ | Description |
---|---|---|
error |
Objekt chyby. |
FieldMapping
Definuje mapování mezi polem ve zdroji dat a cílovým polem v indexu.
Name | Typ | Description |
---|---|---|
mappingFunction |
Funkce, která se před indexováním použije na každou hodnotu zdrojového pole. |
|
sourceFieldName |
string |
Název pole ve zdroji dat. |
targetFieldName |
string |
Název cílového pole v indexu. Stejné jako název zdrojového pole ve výchozím nastavení. |
FieldMappingFunction
Představuje funkci, která transformuje hodnotu ze zdroje dat před indexováním.
Name | Typ | Description |
---|---|---|
name |
string |
Název funkce mapování polí. |
parameters |
object |
Slovník dvojic název/hodnota parametru, který se předá funkci. Každá hodnota musí být primitivního typu. |
IndexerExecutionEnvironment
Určuje prostředí, ve kterém se má indexer spustit.
Name | Typ | Description |
---|---|---|
private |
string |
Označuje, že indexer by měl běžet s prostředím zřízeným speciálně pro vyhledávací službu. To by se mělo zadat jako spouštěcí prostředí pouze v případě, že indexer potřebuje zabezpečený přístup k prostředkům přes prostředky sdíleného privátního propojení. |
standard |
string |
Označuje, že vyhledávací služba může určit, kde se má indexer spustit. Toto je výchozí prostředí, pokud není zadáno nic a jedná se o doporučenou hodnotu. |
IndexingParameters
Představuje parametry pro spuštění indexeru.
Name | Typ | Default value | Description |
---|---|---|---|
batchSize |
integer |
Počet položek, které jsou načteny ze zdroje dat a indexovány jako jedna dávka za účelem zvýšení výkonu. Výchozí hodnota závisí na typu zdroje dat. |
|
configuration |
Slovník vlastností konfigurace specifických pro indexer. Každý název je název konkrétní vlastnosti. Každá hodnota musí být primitivního typu. |
||
maxFailedItems |
integer |
0 |
Maximální počet položek, u které může dojít k selhání indexeru při provádění indexeru, se stále považují za úspěšné. -1 znamená bez omezení. Výchozí hodnota je 0. |
maxFailedItemsPerBatch |
integer |
0 |
Maximální počet položek v jedné dávce, u které může dojít k selhání indexování, aby byla dávka stále považována za úspěšnou. -1 znamená bez omezení. Výchozí hodnota je 0. |
IndexingParametersConfiguration
Slovník vlastností konfigurace specifických pro indexer. Každý název je název konkrétní vlastnosti. Každá hodnota musí být primitivního typu.
Name | Typ | Default value | Description |
---|---|---|---|
allowSkillsetToReadFileData |
boolean |
False |
Pokud je true, vytvoří cestu //document//file_data, což je objekt představující data původního souboru stažená ze zdroje dat objektu blob. To vám umožní předat původní data souboru vlastní dovednosti ke zpracování v rámci kanálu pro rozšiřování nebo dovednosti extrakce dokumentů. |
dataToExtract | contentAndMetadata |
Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je vlastnost imageAction nastavená na jinou hodnotu než "none". To platí pro vložený obsah obrázku v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure. |
|
delimitedTextDelimiter |
string |
Pro objekty blob CSV určuje oddělovač jednoho znaku na konci řádku pro soubory CSV, kde každý řádek začíná nový dokument (například |). |
|
delimitedTextHeaders |
string |
Pro objekty blob CSV určuje seznam záhlaví sloupců oddělených čárkami, který je užitečný pro mapování zdrojových polí na cílová pole v indexu. |
|
documentRoot |
string |
U polí JSON můžete u strukturovaného nebo částečně strukturovaného dokumentu určit cestu k poli pomocí této vlastnosti. |
|
excludedFileNameExtensions |
string |
Seznam přípon názvů souborů oddělených čárkami, které se mají při zpracování z úložiště objektů blob v Azure ignorovat. Můžete například vyloučit ".png, .mp4", abyste tyto soubory během indexování přeskočili. |
|
executionEnvironment | standard |
Určuje prostředí, ve kterém se má indexer spustit. |
|
failOnUnprocessableDocument |
boolean |
False |
V případě objektů blob Azure nastavte na false, pokud chcete pokračovat v indexování, pokud se indexování dokumentu nezdaří. |
failOnUnsupportedContentType |
boolean |
False |
U objektů blob Azure nastavte na false, pokud chcete pokračovat v indexování, když se zjistí nepodporovaný typ obsahu a neznáte předem všechny typy obsahu (přípony souborů). |
firstLineContainsHeaders |
boolean |
True |
U objektů blob sdíleného svazku clusteru označuje, že první (neprázdný) řádek každého objektu blob obsahuje hlavičky. |
imageAction | none |
Určuje způsob zpracování vložených obrázků a souborů obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jinou hodnotu než "none" vyžaduje, aby byla k danému indexeru připojena také sada dovedností. |
|
indexStorageMetadataOnlyForOversizedDocuments |
boolean |
False |
U objektů blob Azure nastavte tuto vlastnost na true, aby se stále indexují metadata úložiště pro obsah objektů blob, který je příliš velký na zpracování. Objekty blob naddimenzované jsou ve výchozím nastavení považovány za chyby. Omezení velikosti objektu blob najdete v tématu https://docs.microsoft.com/azure/search/search-limits-quotas-capacity. |
indexedFileNameExtensions |
string |
Seznam přípon názvů souborů oddělených čárkami, které se mají vybrat při zpracování ze služby Azure Blob Storage. Můžete se například zaměřit na indexování konkrétních aplikačních souborů ".docx, .pptx, .msg", aby se zahrnuly konkrétně tyto typy souborů. |
|
parsingMode | default |
Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure. |
|
pdfTextRotationAlgorithm | none |
Určuje algoritmus pro extrakci textu ze souborů PDF ve službě Azure Blob Storage. |
|
queryTimeout |
string |
00:05:00 |
Zvýší časový limit nad výchozí 5 minut pro Azure SQL zdroje dat databáze zadané ve formátu hh:mm:ss. |
IndexingSchedule
Představuje plán spuštění indexeru.
Name | Typ | Description |
---|---|---|
interval |
string |
Časový interval mezi spuštěními indexeru. |
startTime |
string |
Čas, kdy by se měl spustit indexer. |
SearchIndexer
Představuje indexer.
Name | Typ | Default value | Description |
---|---|---|---|
@odata.etag |
string |
Značka ETag indexeru. |
|
cache |
Přidá ukládání do mezipaměti do kanálu rozšiřování, aby bylo možné provádět kroky přírůstkových změn, aniž by bylo nutné index pokaždé znovu sestavovat. |
||
dataSourceName |
string |
Název zdroje dat, ze kterého indexer čte data. |
|
description |
string |
Popis indexeru. |
|
disabled |
boolean |
False |
Hodnota označující, zda je indexer zakázán. Výchozí hodnota je false. |
encryptionKey |
Popis šifrovacího klíče, který vytvoříte v Azure Key Vault. Tento klíč slouží k poskytnutí další úrovně šifrování neaktivních uložených dat pro definici indexeru (a také stav spuštění indexeru), pokud chcete mít plnou jistotu, že je nikdo, dokonce ani Microsoft, nemůže dešifrovat. Jakmile zašifrujete definici indexeru, zůstane vždy zašifrovaná. Vyhledávací služba bude ignorovat pokusy o nastavení této vlastnosti na hodnotu null. Pokud chcete šifrovací klíč obměnit, můžete tuto vlastnost podle potřeby změnit. Definice indexeru (a stav spuštění indexeru) nebude ovlivněna. Šifrování pomocí klíčů spravovaných zákazníkem není k dispozici pro bezplatné vyhledávací služby a je k dispozici pouze pro placené služby vytvořené 1. ledna 2019 nebo později. |
||
fieldMappings |
Definuje mapování mezi poli ve zdroji dat a odpovídajícími cílovými poli v indexu. |
||
name |
string |
Název indexeru. |
|
outputFieldMappings |
Mapování výstupních polí se použijí po rozšíření a bezprostředně před indexováním. |
||
parameters |
Parametry pro spuštění indexeru |
||
schedule |
Plán pro tento indexer. |
||
skillsetName |
string |
Název sady dovedností spouštěné pomocí tohoto indexeru. |
|
targetIndexName |
string |
Název indexu, do kterého tento indexer zapisuje data. |
SearchIndexerCache
Name | Typ | Description |
---|---|---|
enableReprocessing |
boolean |
Určuje, jestli je povolené přírůstkové opětovné zpracování. |
identity | SearchIndexerDataIdentity: |
Spravovaná identita přiřazená uživatelem používaná pro připojení k mezipaměti pro rozšiřování. Pokud připojovací řetězec označuje identitu (Id prostředku) a není zadaná, použije se spravovaná identita přiřazená systémem. Pokud při aktualizaci indexeru není identita určená, zůstane hodnota beze změny. Pokud je nastavená hodnota "none", hodnota této vlastnosti se vymaže. |
storageConnectionString |
string |
Připojovací řetězec k účtu úložiště, ve kterém budou uložena data mezipaměti. |
SearchIndexerDataNoneIdentity
Vymaže vlastnost identity zdroje dat.
Name | Typ | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Fragment identifikátoru URI určující typ identity. |
SearchIndexerDataUserAssignedIdentity
Určuje identitu pro zdroj dat, který se má použít.
Name | Typ | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Fragment identifikátoru URI určující typ identity. |
userAssignedIdentity |
string |
Plně kvalifikované ID prostředku Azure spravované identity přiřazené uživatelem obvykle ve tvaru /subscriptions/12345678-1234-1234-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId, které by mělo být přiřazeno vyhledávací službě. |
SearchResourceEncryptionKey
Šifrovací klíč spravovaný zákazníkem v Azure Key Vault. Klíče, které vytvoříte a spravujete, můžete použít k šifrování nebo dešifrování neaktivních uložených dat, jako jsou indexy a mapy synonym.
Name | Typ | Description |
---|---|---|
accessCredentials |
Volitelné přihlašovací údaje Azure Active Directory používané pro přístup k azure Key Vault. Nevyžaduje se, pokud místo toho používáte spravovanou identitu. |
|
identity | SearchIndexerDataIdentity: |
Explicitní spravovaná identita, která se má použít pro tento šifrovací klíč. Pokud není zadaný a vlastnost přihlašovacích údajů přístupu má hodnotu null, použije se spravovaná identita přiřazená systémem. Pokud po aktualizaci prostředku explicitní identita není určená, zůstane beze změny. Pokud je zadána hodnota "none", hodnota této vlastnosti bude vymazána. |
keyVaultKeyName |
string |
Název klíče Azure Key Vault, který se má použít k šifrování neaktivních uložených dat. |
keyVaultKeyVersion |
string |
Verze klíče Azure Key Vault, který se má použít k šifrování neaktivních uložených dat. |
keyVaultUri |
string |
Identifikátor URI vašeho Key Vault Azure, označovaný také jako název DNS, který obsahuje klíč, který se má použít k šifrování neaktivních uložených dat. Příkladem identifikátoru URI může být |