Indexers - Create
Vytvoří nový indexer.
POST {endpoint}/indexers?api-version=2024-07-01
Parametry identifikátoru URI
Name | V | Vyžadováno | Typ | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Adresa URL koncového bodu vyhledávací služby. |
api-version
|
query | True |
string |
Verze rozhraní API klienta. |
Hlavička požadavku
Name | Vyžadováno | Typ | Description |
---|---|---|---|
x-ms-client-request-id |
string uuid |
ID sledování odeslané s požadavkem, které vám pomůže s laděním. |
Text požadavku
Name | Vyžadováno | Typ | Description |
---|---|---|---|
dataSourceName | True |
string |
Název zdroje dat, ze kterého tento indexer čte data. |
name | True |
string |
Název indexeru. |
targetIndexName | True |
string |
Název indexu, do kterého tento indexer zapisuje data. |
@odata.etag |
string |
ETag indexeru. |
|
description |
string |
Popis indexeru. |
|
disabled |
boolean |
Hodnota označující, zda je indexer zakázán. Výchozí hodnota je false. |
|
encryptionKey |
Popis šifrovacího klíče, který vytvoříte ve službě Azure Key Vault. Tento klíč se používá k zajištění další úrovně neaktivních uložených šifrování pro definici indexeru (stejně jako stav spuštění indexeru), pokud chcete mít plnou jistotu, že je nikdo, ani Microsoft, může dešifrovat. Jakmile zašifrujete definici indexeru, zůstane vždy zašifrovaná. Vyhledávací služba bude ignorovat pokusy o nastavení této vlastnosti na hodnotu null. Tuto vlastnost můžete podle potřeby změnit, pokud chcete šifrovací klíč otočit; Definice indexeru (a stav spuštění indexeru) nebude mít vliv. Šifrování pomocí klíčů spravovaných zákazníkem není k dispozici pro bezplatné vyhledávací služby a je k dispozici pouze pro placené služby vytvořené 1. ledna 2019 nebo po 1. lednu 2019. |
||
fieldMappings |
Definuje mapování mezi poli ve zdroji dat a odpovídajícími cílovými poli v indexu. |
||
outputFieldMappings |
Mapování výstupníchpolích |
||
parameters |
Parametry pro spuštění indexeru |
||
schedule |
Plán pro tento indexer. |
||
skillsetName |
string |
Název sady dovedností, která se spouští s tímto indexerem. |
Odpovědi
Name | Typ | Description |
---|---|---|
201 Created | ||
Other Status Codes |
Chybová odpověď. |
Příklady
SearchServiceCreateIndexer
Ukázkový požadavek
POST https://myservice.search.windows.net/indexers?api-version=2024-07-01
{
"name": "myindexer",
"description": "an indexer",
"dataSourceName": "mydatasource",
"targetIndexName": "orders",
"schedule": {
"interval": "PT1H",
"startTime": "2015-01-01T00:00:00Z"
},
"parameters": {
"maxFailedItems": 10,
"maxFailedItemsPerBatch": 5
},
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": "<applicationSecret>"
}
}
}
Ukázková odpověď
{
"name": "myindexer",
"description": "an indexer",
"dataSourceName": "mydatasource",
"targetIndexName": "orders",
"schedule": {
"interval": "PT1H",
"startTime": "2015-01-01T00:00:00Z"
},
"parameters": {
"maxFailedItems": 10,
"maxFailedItemsPerBatch": 5
},
"fieldMappings": [],
"disabled": false,
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": null
}
}
}
Definice
Name | Description |
---|---|
Azure |
Přihlašovací údaje registrované aplikace vytvořené pro vaši vyhledávací službu, které slouží k ověřenému přístupu k šifrovacím klíčům uloženým ve službě Azure Key Vault. |
Blob |
Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je vlastnost imageAction nastavená na jinou hodnotu než žádná. To platí pro vložený obsah obrázku v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure. |
Blob |
Určuje, jak zpracovávat vložené obrázky a soubory obrázků v Úložišti objektů blob v Azure. Nastavení konfigurace imageAction na jinou hodnotu než žádná vyžaduje, aby byla k sadě dovedností připojena také tato sada dovedností. |
Blob |
Představuje režim analýzy indexování ze zdroje dat objektů blob Azure. |
Blob |
Určuje algoritmus extrakce textu ze souborů PDF v úložišti objektů blob v Azure. |
Error |
Další informace o chybě správy prostředků |
Error |
Podrobnosti o chybě. |
Error |
Chybová odpověď |
Field |
Definuje mapování mezi polem ve zdroji dat a cílovým polem v indexu. |
Field |
Představuje funkci, která před indexováním transformuje hodnotu ze zdroje dat. |
Indexer |
Určuje prostředí, ve kterém má indexer provést. |
Indexing |
Představuje parametry pro spuštění indexeru. |
Indexing |
Slovník vlastností konfigurace specifické pro indexer. Každý název je název konkrétní vlastnosti. Každá hodnota musí být primitivního typu. |
Indexing |
Představuje plán provádění indexeru. |
Search |
Představuje indexer. |
Search |
Šifrovací klíč spravovaný zákazníkem ve službě Azure Key Vault. Klíče, které vytvoříte a spravujete, se dají použít k šifrování nebo dešifrování neaktivních uložených dat, jako jsou indexy a mapy synonym. |
AzureActiveDirectoryApplicationCredentials
Přihlašovací údaje registrované aplikace vytvořené pro vaši vyhledávací službu, které slouží k ověřenému přístupu k šifrovacím klíčům uloženým ve službě Azure Key Vault.
Name | Typ | Description |
---|---|---|
applicationId |
string |
ID aplikace AAD, kterému byla udělena požadovaná přístupová oprávnění ke službě Azure Key Vault, která se má použít při šifrování neaktivních uložených dat. ID aplikace by nemělo být zaměňováno s ID objektu pro vaši aplikaci AAD. |
applicationSecret |
string |
Ověřovací klíč zadané aplikace AAD. |
BlobIndexerDataToExtract
Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je vlastnost imageAction nastavená na jinou hodnotu než žádná. To platí pro vložený obsah obrázku v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure.
Name | Typ | Description |
---|---|---|
allMetadata |
string |
Extrahuje metadata poskytovaná subsystémem úložiště objektů blob Azure a metadata specifická pro obsah (například metadata jedinečná pouze pro .png soubory se indexují). |
contentAndMetadata |
string |
Extrahuje všechna metadata a textový obsah z každého objektu blob. |
storageMetadata |
string |
Indexuje pouze standardní vlastnosti objektu blob a uživatelsky zadaná metadata. |
BlobIndexerImageAction
Určuje, jak zpracovávat vložené obrázky a soubory obrázků v Úložišti objektů blob v Azure. Nastavení konfigurace imageAction na jinou hodnotu než žádná vyžaduje, aby byla k sadě dovedností připojena také tato sada dovedností.
Name | Typ | Description |
---|---|---|
generateNormalizedImagePerPage |
string |
Extrahuje text z obrázků (například slovo "STOP" z znaménka zastavení provozu) a vloží ho do pole obsahu, ale zachází se soubory PDF odlišně v tom, že každá stránka se vykresluje jako obrázek a odpovídajícím způsobem normalizuje místo extrahování vložených obrázků. Typy souborů, které nejsou pdf, budou považovány za stejné, jako kdyby bylo nastaveno "generateNormalizedImages". |
generateNormalizedImages |
string |
Extrahuje text z obrázků (například slovo "STOP" z znaménka zastavení provozu) a vloží ho do pole obsahu. Tato akce vyžaduje, aby vlastnost dataToExtract byla nastavena na contentAndMetadata. Normalizovaný obrázek odkazuje na další zpracování, které vede k jednotnému výstupu obrázku, velikosti a otočení, aby se při zahrnutí obrázků do výsledků vizuálního hledání podporoval konzistentní vykreslování. Tyto informace se generují pro každou image při použití této možnosti. |
none |
string |
Ignoruje vložené obrázky nebo soubory obrázků v sadě dat. Toto je výchozí hodnota. |
BlobIndexerParsingMode
Představuje režim analýzy indexování ze zdroje dat objektů blob Azure.
Name | Typ | Description |
---|---|---|
default |
string |
Nastavte na výchozí hodnotu pro normální zpracování souborů. |
delimitedText |
string |
Nastavte na oddělovačText, pokud jsou objekty blob prostými soubory CSV. |
json |
string |
Nastavte na json a extrahujte strukturovaný obsah ze souborů JSON. |
jsonArray |
string |
Nastavte na jsonArray a extrahujte jednotlivé prvky pole JSON jako samostatné dokumenty. |
jsonLines |
string |
Nastavte na jsonLines a extrahujte jednotlivé entity JSON oddělené novým řádkem jako samostatné dokumenty. |
text |
string |
Nastavte na text, aby se zlepšil výkon indexování u souborů ve formátu prostého textu v úložišti objektů blob. |
BlobIndexerPDFTextRotationAlgorithm
Určuje algoritmus extrakce textu ze souborů PDF v úložišti objektů blob v Azure.
Name | Typ | Description |
---|---|---|
detectAngles |
string |
Může generovat lepší a čitelnější extrakci textu ze souborů PDF, které v nich otočily text. Všimněte si, že při použití tohoto parametru může dojít k malému dopadu na rychlost výkonu. Tento parametr se vztahuje pouze na soubory PDF a pouze na soubory PDF s vloženým textem. Pokud se otočený text zobrazí v vloženém obrázku v PDF, tento parametr se nepoužije. |
none |
string |
Využívá normální extrakci textu. Toto je výchozí hodnota. |
ErrorAdditionalInfo
Další informace o chybě správy prostředků
Name | Typ | Description |
---|---|---|
info |
object |
Další informace. |
type |
string |
Další typ informací. |
ErrorDetail
Podrobnosti o chybě.
Name | Typ | Description |
---|---|---|
additionalInfo |
Další informace o chybě. |
|
code |
string |
Kód chyby. |
details |
Podrobnosti o chybě. |
|
message |
string |
Chybová zpráva. |
target |
string |
Cíl chyby. |
ErrorResponse
Chybová odpověď
Name | Typ | Description |
---|---|---|
error |
Objekt chyby. |
FieldMapping
Definuje mapování mezi polem ve zdroji dat a cílovým polem v indexu.
Name | Typ | Description |
---|---|---|
mappingFunction |
Funkce, která se má použít pro každou hodnotu zdrojového pole před indexováním. |
|
sourceFieldName |
string |
Název pole ve zdroji dat. |
targetFieldName |
string |
Název cílového pole v indexu. Stejné jako název zdrojového pole ve výchozím nastavení. |
FieldMappingFunction
Představuje funkci, která před indexováním transformuje hodnotu ze zdroje dat.
Name | Typ | Description |
---|---|---|
name |
string |
Název funkce mapování polí. |
parameters |
object |
Slovník párů název/hodnota parametru, které se předávají funkci. Každá hodnota musí být primitivního typu. |
IndexerExecutionEnvironment
Určuje prostředí, ve kterém má indexer provést.
Name | Typ | Description |
---|---|---|
private |
string |
Označuje, že indexer by měl běžet s prostředím zřízeným speciálně pro vyhledávací službu. Toto nastavení by se mělo zadat pouze jako spouštěcí prostředí, pokud indexer potřebuje zabezpečený přístup k prostředkům přes sdílené prostředky privátního propojení. |
standard |
string |
Označuje, že vyhledávací služba může určit, kde má indexer provést. Toto je výchozí prostředí, pokud není zadáno nic a jedná se o doporučenou hodnotu. |
IndexingParameters
Představuje parametry pro spuštění indexeru.
Name | Typ | Default value | Description |
---|---|---|---|
batchSize |
integer |
Počet položek, které se čtou ze zdroje dat a indexují se jako jedna dávka, aby se zlepšil výkon. Výchozí nastavení závisí na typu zdroje dat. |
|
configuration |
Slovník vlastností konfigurace specifické pro indexer. Každý název je název konkrétní vlastnosti. Každá hodnota musí být primitivního typu. |
||
maxFailedItems |
integer |
0 |
Maximální počet položek, které můžou selhat indexování pro provádění indexeru, se stále považuje za úspěšné. -1 znamená žádný limit. Výchozí hodnota je 0. |
maxFailedItemsPerBatch |
integer |
0 |
Maximální počet položek v jedné dávce, které můžou selhat indexování dávky, aby byla stále považována za úspěšnou. -1 znamená žádný limit. Výchozí hodnota je 0. |
IndexingParametersConfiguration
Slovník vlastností konfigurace specifické pro indexer. Každý název je název konkrétní vlastnosti. Každá hodnota musí být primitivního typu.
Name | Typ | Default value | Description |
---|---|---|---|
allowSkillsetToReadFileData |
boolean |
False |
Pokud je hodnota true, vytvoří se cesta //document//file_data, která představuje původní data souboru stažená z vašeho zdroje dat objektu blob. To vám umožní předat původní data souboru vlastní dovednosti pro zpracování v rámci kanálu rozšiřování nebo do dovednosti extrakce dokumentů. |
dataToExtract | contentAndMetadata |
Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je vlastnost imageAction nastavená na jinou hodnotu než žádná. To platí pro vložený obsah obrázku v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure. |
|
delimitedTextDelimiter |
string |
U objektů blob sdíleného svazku clusteru určuje oddělovač jednoho řádku pro soubory CSV, kde každý řádek začíná novým dokumentem (například |). |
|
delimitedTextHeaders |
string |
Pro objekty blob sdíleného svazku clusteru určuje čárkami oddělený seznam záhlaví sloupců, který je užitečný pro mapování zdrojových polí na cílová pole v indexu. |
|
documentRoot |
string |
Pro pole JSON, vzhledem k strukturovanému nebo částečně strukturovanému dokumentu, můžete zadat cestu k poli pomocí této vlastnosti. |
|
excludedFileNameExtensions |
string |
Čárkami oddělený seznam přípon souborů, které se při zpracování z Úložiště objektů blob v Azure ignorují. Můžete například vyloučit ".png, .mp4" a přeskočit tyto soubory během indexování. |
|
executionEnvironment | standard |
Určuje prostředí, ve kterém má indexer provést. |
|
failOnUnprocessableDocument |
boolean |
False |
U objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud se indexování dokumentu nezdaří. |
failOnUnsupportedContentType |
boolean |
False |
U objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud je zjištěn nepodporovaný typ obsahu a neznáte všechny typy obsahu (přípony souborů) předem. |
firstLineContainsHeaders |
boolean |
True |
U objektů blob CSV označuje, že první (neprázdný) řádek každého objektu blob obsahuje hlavičky. |
imageAction | none |
Určuje, jak zpracovávat vložené obrázky a soubory obrázků v Úložišti objektů blob v Azure. Nastavení konfigurace imageAction na jinou hodnotu než žádná vyžaduje, aby byla k sadě dovedností připojena také tato sada dovedností. |
|
indexStorageMetadataOnlyForOversizedDocuments |
boolean |
False |
U objektů blob Azure nastavte tuto vlastnost na true, aby stále indexovat metadata úložiště pro obsah objektů blob, který je příliš velký na zpracování. Nadlimitní objekty blob se ve výchozím nastavení považují za chyby. Omezení velikosti objektu blob najdete v tématu https://learn.microsoft.com/azure/search/search-limits-quotas-capacity. |
indexedFileNameExtensions |
string |
Seznam přípon souborů oddělených čárkami, které se mají vybrat při zpracování ze služby Azure Blob Storage. Můžete se například zaměřit na indexování na konkrétní soubory aplikace ".docx, .pptx, .msg" tak, aby byly tyto typy souborů konkrétně zahrnuty. |
|
parsingMode | default |
Představuje režim analýzy indexování ze zdroje dat objektů blob Azure. |
|
pdfTextRotationAlgorithm | none |
Určuje algoritmus extrakce textu ze souborů PDF v úložišti objektů blob v Azure. |
|
queryTimeout |
string |
00:05:00 |
Zvýší časový limit nad rámec 5minutového výchozího nastavení pro zdroje dat databáze Azure SQL, který je zadaný ve formátu hh:mm:ss. |
IndexingSchedule
Představuje plán provádění indexeru.
Name | Typ | Description |
---|---|---|
interval |
string |
Interval času mezi spuštěními indexeru. |
startTime |
string |
Čas spuštění indexeru. |
SearchIndexer
Představuje indexer.
Name | Typ | Default value | Description |
---|---|---|---|
@odata.etag |
string |
ETag indexeru. |
|
dataSourceName |
string |
Název zdroje dat, ze kterého tento indexer čte data. |
|
description |
string |
Popis indexeru. |
|
disabled |
boolean |
False |
Hodnota označující, zda je indexer zakázán. Výchozí hodnota je false. |
encryptionKey |
Popis šifrovacího klíče, který vytvoříte ve službě Azure Key Vault. Tento klíč se používá k zajištění další úrovně neaktivních uložených šifrování pro definici indexeru (stejně jako stav spuštění indexeru), pokud chcete mít plnou jistotu, že je nikdo, ani Microsoft, může dešifrovat. Jakmile zašifrujete definici indexeru, zůstane vždy zašifrovaná. Vyhledávací služba bude ignorovat pokusy o nastavení této vlastnosti na hodnotu null. Tuto vlastnost můžete podle potřeby změnit, pokud chcete šifrovací klíč otočit; Definice indexeru (a stav spuštění indexeru) nebude mít vliv. Šifrování pomocí klíčů spravovaných zákazníkem není k dispozici pro bezplatné vyhledávací služby a je k dispozici pouze pro placené služby vytvořené 1. ledna 2019 nebo po 1. lednu 2019. |
||
fieldMappings |
Definuje mapování mezi poli ve zdroji dat a odpovídajícími cílovými poli v indexu. |
||
name |
string |
Název indexeru. |
|
outputFieldMappings |
Mapování výstupníchpolích |
||
parameters |
Parametry pro spuštění indexeru |
||
schedule |
Plán pro tento indexer. |
||
skillsetName |
string |
Název sady dovedností, která se spouští s tímto indexerem. |
|
targetIndexName |
string |
Název indexu, do kterého tento indexer zapisuje data. |
SearchResourceEncryptionKey
Šifrovací klíč spravovaný zákazníkem ve službě Azure Key Vault. Klíče, které vytvoříte a spravujete, se dají použít k šifrování nebo dešifrování neaktivních uložených dat, jako jsou indexy a mapy synonym.
Name | Typ | Description |
---|---|---|
accessCredentials |
Volitelné přihlašovací údaje Azure Active Directory používané pro přístup ke službě Azure Key Vault. Nevyžaduje se, pokud místo toho používáte spravovanou identitu. |
|
keyVaultKeyName |
string |
Název klíče služby Azure Key Vault, který se má použít k šifrování neaktivních uložených dat. |
keyVaultKeyVersion |
string |
Verze klíče služby Azure Key Vault, která se má použít k šifrování neaktivních uložených dat. |
keyVaultUri |
string |
Identifikátor URI služby Azure Key Vault, označovaný také jako název DNS, který obsahuje klíč, který se má použít k šifrování neaktivních uložených dat. Příkladem identifikátoru URI může být |