Indexers - Create
Hiermee maakt u een nieuwe indexeerfunctie.
POST {endpoint}/indexers?api-version=2024-07-01
URI-parameters
Name | In | Vereist | Type | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
De eindpunt-URL van de zoekservice. |
api-version
|
query | True |
string |
Client-API-versie. |
Aanvraagkoptekst
Name | Vereist | Type | Description |
---|---|---|---|
x-ms-client-request-id |
string uuid |
De tracerings-id die is verzonden met de aanvraag om hulp te bieden bij foutopsporing. |
Aanvraagbody
Name | Vereist | Type | Description |
---|---|---|---|
dataSourceName | True |
string |
De naam van de gegevensbron waaruit deze indexeerfunctie gegevens leest. |
name | True |
string |
De naam van de indexeerfunctie. |
targetIndexName | True |
string |
De naam van de index waarnaar deze indexeerfunctie gegevens schrijft. |
@odata.etag |
string |
De ETag van de indexeerfunctie. |
|
description |
string |
De beschrijving van de indexeerfunctie. |
|
disabled |
boolean |
Een waarde die aangeeft of de indexeerfunctie is uitgeschakeld. De standaardwaarde is onwaar. |
|
encryptionKey |
Een beschrijving van een versleutelingssleutel die u in Azure Key Vault maakt. Deze sleutel wordt gebruikt om een extra versleutelings-at-rest-niveau te bieden voor de definitie van uw indexeerfunctie (evenals de uitvoeringsstatus van de indexeerfunctie) als u volledige zekerheid wilt dat niemand, zelfs Microsoft, deze kan ontsleutelen. Zodra u de definitie van de indexeerfunctie hebt versleuteld, blijft deze altijd versleuteld. De zoekservice negeert pogingen om deze eigenschap in te stellen op null. U kunt deze eigenschap indien nodig wijzigen als u uw versleutelingssleutel wilt draaien; De definitie van de indexeerfunctie (en de uitvoeringsstatus van de indexeerfunctie) wordt niet beïnvloed. Versleuteling met door de klant beheerde sleutels is niet beschikbaar voor gratis zoekservices en is alleen beschikbaar voor betaalde services die zijn gemaakt op of na 1 januari 2019. |
||
fieldMappings |
Definieert toewijzingen tussen velden in de gegevensbron en bijbehorende doelvelden in de index. |
||
outputFieldMappings |
Uitvoerveldtoewijzingen worden toegepast na verrijking en direct voor indexering. |
||
parameters |
Parameters voor de uitvoering van de indexeerfunctie. |
||
schedule |
Het schema voor deze indexeerfunctie. |
||
skillsetName |
string |
De naam van de vaardighedenset die wordt uitgevoerd met deze indexeerfunctie. |
Antwoorden
Name | Type | Description |
---|---|---|
201 Created | ||
Other Status Codes |
Foutreactie. |
Voorbeelden
SearchServiceCreateIndexer
Voorbeeldaanvraag
POST https://myservice.search.windows.net/indexers?api-version=2024-07-01
{
"name": "myindexer",
"description": "an indexer",
"dataSourceName": "mydatasource",
"targetIndexName": "orders",
"schedule": {
"interval": "PT1H",
"startTime": "2015-01-01T00:00:00Z"
},
"parameters": {
"maxFailedItems": 10,
"maxFailedItemsPerBatch": 5
},
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": "<applicationSecret>"
}
}
}
Voorbeeldrespons
{
"name": "myindexer",
"description": "an indexer",
"dataSourceName": "mydatasource",
"targetIndexName": "orders",
"schedule": {
"interval": "PT1H",
"startTime": "2015-01-01T00:00:00Z"
},
"parameters": {
"maxFailedItems": 10,
"maxFailedItemsPerBatch": 5
},
"fieldMappings": [],
"disabled": false,
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": null
}
}
}
Definities
Name | Description |
---|---|
Azure |
Referenties van een geregistreerde toepassing die is gemaakt voor uw zoekservice, die wordt gebruikt voor geverifieerde toegang tot de versleutelingssleutels die zijn opgeslagen in Azure Key Vault. |
Blob |
Hiermee geeft u de gegevens op die moeten worden geëxtraheerd uit Azure Blob Storage en wordt aan de indexeerfunctie aangegeven welke gegevens moeten worden geëxtraheerd uit afbeeldingsinhoud wanneer 'imageAction' is ingesteld op een andere waarde dan 'geen'. Dit geldt voor ingesloten afbeeldingsinhoud in een .PDF of andere toepassing, of afbeeldingsbestanden zoals .jpg en .png, in Azure-blobs. |
Blob |
Bepaalt hoe u ingesloten afbeeldingen en afbeeldingsbestanden verwerkt in Azure Blob Storage. Als u de configuratie 'imageAction' instelt op een andere waarde dan 'geen', moet er ook een vaardighedenset aan die indexeerfunctie worden gekoppeld. |
Blob |
Vertegenwoordigt de parseermodus voor indexering vanuit een Azure Blob-gegevensbron. |
Blob |
Bepaalt het algoritme voor tekstextractie van PDF-bestanden in Azure Blob Storage. |
Error |
Aanvullende informatie over de resourcebeheerfout. |
Error |
De foutdetails. |
Error |
Foutreactie |
Field |
Definieert een toewijzing tussen een veld in een gegevensbron en een doelveld in een index. |
Field |
Vertegenwoordigt een functie die een waarde transformeert uit een gegevensbron voordat u indexeert. |
Indexer |
Hiermee geeft u de omgeving waarin de indexeerfunctie moet worden uitgevoerd. |
Indexing |
Vertegenwoordigt parameters voor de uitvoering van de indexeerfunctie. |
Indexing |
Een woordenlijst met configuratie-eigenschappen die specifiek zijn voor een indexeerfunctie. Elke naam is de naam van een specifieke eigenschap. Elke waarde moet van een primitief type zijn. |
Indexing |
Vertegenwoordigt een schema voor de uitvoering van de indexeerfunctie. |
Search |
Vertegenwoordigt een indexeerfunctie. |
Search |
Een door de klant beheerde versleutelingssleutel in Azure Key Vault. Sleutels die u maakt en beheert, kunnen worden gebruikt voor het versleutelen of ontsleutelen van data-at-rest, zoals indexen en synoniemenkaarten. |
AzureActiveDirectoryApplicationCredentials
Referenties van een geregistreerde toepassing die is gemaakt voor uw zoekservice, die wordt gebruikt voor geverifieerde toegang tot de versleutelingssleutels die zijn opgeslagen in Azure Key Vault.
Name | Type | Description |
---|---|---|
applicationId |
string |
Een AAD-toepassings-id waaraan de vereiste toegangsmachtigingen zijn verleend voor de Azure Key Vault die moet worden gebruikt bij het versleutelen van uw data-at-rest. De toepassings-id mag niet worden verward met de object-id voor uw AAD-toepassing. |
applicationSecret |
string |
De verificatiesleutel van de opgegeven AAD-toepassing. |
BlobIndexerDataToExtract
Hiermee geeft u de gegevens op die moeten worden geëxtraheerd uit Azure Blob Storage en wordt aan de indexeerfunctie aangegeven welke gegevens moeten worden geëxtraheerd uit afbeeldingsinhoud wanneer 'imageAction' is ingesteld op een andere waarde dan 'geen'. Dit geldt voor ingesloten afbeeldingsinhoud in een .PDF of andere toepassing, of afbeeldingsbestanden zoals .jpg en .png, in Azure-blobs.
Name | Type | Description |
---|---|---|
allMetadata |
string |
Extraheert metagegevens die worden geleverd door het Azure Blob Storage-subsysteem en de inhoudstypespecifieke metagegevens (bijvoorbeeld metagegevens die uniek zijn voor alleen .png bestanden worden geïndexeerd). |
contentAndMetadata |
string |
Hiermee worden alle metagegevens en tekstuele inhoud uit elke blob geëxtraheerd. |
storageMetadata |
string |
Indexeert alleen de standaardblobeigenschappen en door de gebruiker opgegeven metagegevens. |
BlobIndexerImageAction
Bepaalt hoe u ingesloten afbeeldingen en afbeeldingsbestanden verwerkt in Azure Blob Storage. Als u de configuratie 'imageAction' instelt op een andere waarde dan 'geen', moet er ook een vaardighedenset aan die indexeerfunctie worden gekoppeld.
Name | Type | Description |
---|---|---|
generateNormalizedImagePerPage |
string |
Extraheert tekst uit afbeeldingen (bijvoorbeeld het woord 'STOP' van een verkeersstopteken) en sluit deze in het inhoudsveld in, maar behandelt PDF-bestanden anders in dat elke pagina wordt weergegeven als een afbeelding en dienovereenkomstig genormaliseerd, in plaats van ingesloten afbeeldingen te extraheren. Niet-PDF-bestandstypen worden hetzelfde behandeld als 'generateNormalizedImages' is ingesteld. |
generateNormalizedImages |
string |
Extraheert tekst uit afbeeldingen (bijvoorbeeld het woord 'STOP' van een verkeersstopteken) en sluit deze in het inhoudsveld in. Deze actie vereist dat dataToExtract is ingesteld op 'contentAndMetadata'. Een genormaliseerde afbeelding verwijst naar extra verwerking die resulteert in uniforme afbeeldingsuitvoer, grootte en gedraaid om consistente rendering te bevorderen wanneer u afbeeldingen in visuele zoekresultaten opneemt. Deze informatie wordt gegenereerd voor elke afbeelding wanneer u deze optie gebruikt. |
none |
string |
Hiermee worden ingesloten afbeeldingen of afbeeldingsbestanden in de gegevensset genegeerd. Dit is de standaardwaarde. |
BlobIndexerParsingMode
Vertegenwoordigt de parseermodus voor indexering vanuit een Azure Blob-gegevensbron.
Name | Type | Description |
---|---|---|
default |
string |
Ingesteld op standaard voor normale bestandsverwerking. |
delimitedText |
string |
Ingesteld op delimitedText wanneer blobs gewone CSV-bestanden zijn. |
json |
string |
Ingesteld op json om gestructureerde inhoud uit JSON-bestanden te extraheren. |
jsonArray |
string |
Ingesteld op jsonArray om afzonderlijke elementen van een JSON-matrix als afzonderlijke documenten te extraheren. |
jsonLines |
string |
Stel deze optie in op jsonLines om afzonderlijke JSON-entiteiten te extraheren, gescheiden door een nieuwe regel, als afzonderlijke documenten. |
text |
string |
Ingesteld op tekst om de indexeringsprestaties voor tekstbestanden zonder opmaak in blobopslag te verbeteren. |
BlobIndexerPDFTextRotationAlgorithm
Bepaalt het algoritme voor tekstextractie van PDF-bestanden in Azure Blob Storage.
Name | Type | Description |
---|---|---|
detectAngles |
string |
Kan betere en beter leesbare tekstextractie produceren uit PDF-bestanden die tekst erin hebben gedraaid. Houd er rekening mee dat er mogelijk een kleine invloed op de prestatiesnelheid is wanneer deze parameter wordt gebruikt. Deze parameter is alleen van toepassing op PDF-bestanden en alleen op PDF-bestanden met ingesloten tekst. Als de gedraaide tekst wordt weergegeven in een ingesloten afbeelding in het PDF-bestand, is deze parameter niet van toepassing. |
none |
string |
Maakt gebruik van normale tekstextractie. Dit is de standaardwaarde. |
ErrorAdditionalInfo
Aanvullende informatie over de resourcebeheerfout.
Name | Type | Description |
---|---|---|
info |
object |
De aanvullende informatie. |
type |
string |
Het extra informatietype. |
ErrorDetail
De foutdetails.
Name | Type | Description |
---|---|---|
additionalInfo |
De fout bevat aanvullende informatie. |
|
code |
string |
De foutcode. |
details |
De foutdetails. |
|
message |
string |
Het foutbericht. |
target |
string |
Het foutdoel. |
ErrorResponse
Foutreactie
Name | Type | Description |
---|---|---|
error |
Het foutobject. |
FieldMapping
Definieert een toewijzing tussen een veld in een gegevensbron en een doelveld in een index.
Name | Type | Description |
---|---|---|
mappingFunction |
Een functie die moet worden toegepast op elke waarde van het bronveld voordat u indexeert. |
|
sourceFieldName |
string |
De naam van het veld in de gegevensbron. |
targetFieldName |
string |
De naam van het doelveld in de index. Hetzelfde als de naam van het bronveld. |
FieldMappingFunction
Vertegenwoordigt een functie die een waarde transformeert uit een gegevensbron voordat u indexeert.
Name | Type | Description |
---|---|---|
name |
string |
De naam van de veldtoewijzingsfunctie. |
parameters |
object |
Een woordenlijst met parameternaam/waardeparen die aan de functie moeten worden doorgegeven. Elke waarde moet van een primitief type zijn. |
IndexerExecutionEnvironment
Hiermee geeft u de omgeving waarin de indexeerfunctie moet worden uitgevoerd.
Name | Type | Description |
---|---|---|
private |
string |
Geeft aan dat de indexeerfunctie moet worden uitgevoerd met de omgeving die specifiek is ingericht voor de zoekservice. Dit moet alleen worden opgegeven als de uitvoeringsomgeving als de indexeerfunctie veilig toegang nodig heeft tot resources via gedeelde private link-resources. |
standard |
string |
Geeft aan dat de zoekservice kan bepalen waar de indexeerfunctie moet worden uitgevoerd. Dit is de standaardomgeving wanneer er niets is opgegeven en de aanbevolen waarde is. |
IndexingParameters
Vertegenwoordigt parameters voor de uitvoering van de indexeerfunctie.
Name | Type | Default value | Description |
---|---|---|---|
batchSize |
integer |
Het aantal items dat uit de gegevensbron wordt gelezen en geïndexeerd als één batch om de prestaties te verbeteren. De standaardwaarde is afhankelijk van het gegevensbrontype. |
|
configuration |
Een woordenlijst met configuratie-eigenschappen die specifiek zijn voor een indexeerfunctie. Elke naam is de naam van een specifieke eigenschap. Elke waarde moet van een primitief type zijn. |
||
maxFailedItems |
integer |
0 |
Het maximum aantal items dat kan mislukken bij het indexeren voor de uitvoering van de indexeerfunctie, wordt nog steeds beschouwd als geslaagd. -1 betekent geen limiet. De standaardwaarde is 0. |
maxFailedItemsPerBatch |
integer |
0 |
Het maximum aantal items in één batch dat kan mislukken bij het indexeren van de batch, wordt nog steeds beschouwd als geslaagd. -1 betekent geen limiet. De standaardwaarde is 0. |
IndexingParametersConfiguration
Een woordenlijst met configuratie-eigenschappen die specifiek zijn voor een indexeerfunctie. Elke naam is de naam van een specifieke eigenschap. Elke waarde moet van een primitief type zijn.
Name | Type | Default value | Description |
---|---|---|---|
allowSkillsetToReadFileData |
boolean |
False |
Als waar is, maakt u een pad //document//file_data dat een object is dat de oorspronkelijke bestandsgegevens vertegenwoordigt die zijn gedownload uit uw blobgegevensbron. Hiermee kunt u de oorspronkelijke bestandsgegevens doorgeven aan een aangepaste vaardigheid voor verwerking in de verrijkingspijplijn of aan de vaardigheid Documentextractie. |
dataToExtract | contentAndMetadata |
Hiermee geeft u de gegevens op die moeten worden geëxtraheerd uit Azure Blob Storage en wordt aan de indexeerfunctie aangegeven welke gegevens moeten worden geëxtraheerd uit afbeeldingsinhoud wanneer 'imageAction' is ingesteld op een andere waarde dan 'geen'. Dit geldt voor ingesloten afbeeldingsinhoud in een .PDF of andere toepassing, of afbeeldingsbestanden zoals .jpg en .png, in Azure-blobs. |
|
delimitedTextDelimiter |
string |
Voor CSV-blobs geeft u het scheidingsteken met één teken op voor CSV-bestanden waarop elke regel een nieuw document start (bijvoorbeeld |). |
|
delimitedTextHeaders |
string |
Voor CSV-blobs geeft u een door komma's gescheiden lijst met kolomkoppen op, handig voor het toewijzen van bronvelden aan doelvelden in een index. |
|
documentRoot |
string |
Voor JSON-matrices, op basis van een gestructureerd of semi-gestructureerd document, kunt u een pad naar de matrix opgeven met behulp van deze eigenschap. |
|
excludedFileNameExtensions |
string |
Door komma's gescheiden lijst met bestandsnaamextensies die moeten worden genegeerd bij verwerking vanuit Azure Blob Storage. U kunt bijvoorbeeld '.png, .mp4' uitsluiten om deze bestanden over te slaan tijdens het indexeren. |
|
executionEnvironment | standard |
Hiermee geeft u de omgeving waarin de indexeerfunctie moet worden uitgevoerd. |
|
failOnUnprocessableDocument |
boolean |
False |
Stel voor Azure-blobs in op false als u wilt doorgaan met indexeren als het indexeren van een document mislukt. |
failOnUnsupportedContentType |
boolean |
False |
Stel voor Azure-blobs in op onwaar als u wilt doorgaan met indexeren wanneer er een niet-ondersteund inhoudstype wordt aangetroffen en u niet alle inhoudstypen (bestandsextensies) van tevoren weet. |
firstLineContainsHeaders |
boolean |
True |
Voor CSV-blobs geeft u aan dat de eerste (niet-lege) regel van elke blob headers bevat. |
imageAction | none |
Bepaalt hoe u ingesloten afbeeldingen en afbeeldingsbestanden verwerkt in Azure Blob Storage. Als u de configuratie 'imageAction' instelt op een andere waarde dan 'geen', moet er ook een vaardighedenset aan die indexeerfunctie worden gekoppeld. |
|
indexStorageMetadataOnlyForOversizedDocuments |
boolean |
False |
Voor Azure-blobs stelt u deze eigenschap in op True om nog steeds opslagmetagegevens te indexeren voor blob-inhoud die te groot is om te verwerken. Oversized blobs worden standaard behandeld als fouten. Zie https://learn.microsoft.com/azure/search/search-limits-quotas-capacityvoor limieten voor de blobgrootte. |
indexedFileNameExtensions |
string |
Door komma's gescheiden lijst met bestandsnaamextensies die moeten worden geselecteerd bij verwerking in Azure Blob Storage. U kunt zich bijvoorbeeld richten op indexering op specifieke toepassingsbestanden '.docx, .pptx, .msg' om specifiek deze bestandstypen op te nemen. |
|
parsingMode | default |
Vertegenwoordigt de parseermodus voor indexering vanuit een Azure Blob-gegevensbron. |
|
pdfTextRotationAlgorithm | none |
Bepaalt het algoritme voor tekstextractie van PDF-bestanden in Azure Blob Storage. |
|
queryTimeout |
string |
00:05:00 |
Hiermee wordt de time-out hoger dan de standaardwaarde van 5 minuten voor Azure SQL-databasegegevensbronnen, die zijn opgegeven in de indeling 'uu:mm:ss'. |
IndexingSchedule
Vertegenwoordigt een schema voor de uitvoering van de indexeerfunctie.
Name | Type | Description |
---|---|---|
interval |
string |
Het tijdsinterval tussen uitvoeringen van de indexeerfunctie. |
startTime |
string |
Het tijdstip waarop een indexeerfunctie moet worden uitgevoerd. |
SearchIndexer
Vertegenwoordigt een indexeerfunctie.
Name | Type | Default value | Description |
---|---|---|---|
@odata.etag |
string |
De ETag van de indexeerfunctie. |
|
dataSourceName |
string |
De naam van de gegevensbron waaruit deze indexeerfunctie gegevens leest. |
|
description |
string |
De beschrijving van de indexeerfunctie. |
|
disabled |
boolean |
False |
Een waarde die aangeeft of de indexeerfunctie is uitgeschakeld. De standaardwaarde is onwaar. |
encryptionKey |
Een beschrijving van een versleutelingssleutel die u in Azure Key Vault maakt. Deze sleutel wordt gebruikt om een extra versleutelings-at-rest-niveau te bieden voor de definitie van uw indexeerfunctie (evenals de uitvoeringsstatus van de indexeerfunctie) als u volledige zekerheid wilt dat niemand, zelfs Microsoft, deze kan ontsleutelen. Zodra u de definitie van de indexeerfunctie hebt versleuteld, blijft deze altijd versleuteld. De zoekservice negeert pogingen om deze eigenschap in te stellen op null. U kunt deze eigenschap indien nodig wijzigen als u uw versleutelingssleutel wilt draaien; De definitie van de indexeerfunctie (en de uitvoeringsstatus van de indexeerfunctie) wordt niet beïnvloed. Versleuteling met door de klant beheerde sleutels is niet beschikbaar voor gratis zoekservices en is alleen beschikbaar voor betaalde services die zijn gemaakt op of na 1 januari 2019. |
||
fieldMappings |
Definieert toewijzingen tussen velden in de gegevensbron en bijbehorende doelvelden in de index. |
||
name |
string |
De naam van de indexeerfunctie. |
|
outputFieldMappings |
Uitvoerveldtoewijzingen worden toegepast na verrijking en direct voor indexering. |
||
parameters |
Parameters voor de uitvoering van de indexeerfunctie. |
||
schedule |
Het schema voor deze indexeerfunctie. |
||
skillsetName |
string |
De naam van de vaardighedenset die wordt uitgevoerd met deze indexeerfunctie. |
|
targetIndexName |
string |
De naam van de index waarnaar deze indexeerfunctie gegevens schrijft. |
SearchResourceEncryptionKey
Een door de klant beheerde versleutelingssleutel in Azure Key Vault. Sleutels die u maakt en beheert, kunnen worden gebruikt voor het versleutelen of ontsleutelen van data-at-rest, zoals indexen en synoniemenkaarten.
Name | Type | Description |
---|---|---|
accessCredentials |
Optionele Azure Active Directory-referenties die worden gebruikt voor toegang tot uw Azure Key Vault. Niet vereist als u in plaats daarvan beheerde identiteit gebruikt. |
|
keyVaultKeyName |
string |
De naam van uw Azure Key Vault-sleutel die moet worden gebruikt om uw data-at-rest te versleutelen. |
keyVaultKeyVersion |
string |
De versie van uw Azure Key Vault-sleutel die moet worden gebruikt om uw data-at-rest te versleutelen. |
keyVaultUri |
string |
De URI van uw Azure Key Vault, ook wel DNS-naam genoemd, die de sleutel bevat die moet worden gebruikt voor het versleutelen van uw data-at-rest. Een voorbeeld van een URI kan |